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Prefacio 


Las  cosas  se  deberían  explicar  de  la  forma  más  sencilla  posible,  pero  no  más  sencilla  aún. 
(A.  Einstein) 


Alrededor  de  1920  un  peridodista  preguntó  al  astrofísico  británico  Arthur  Eddington  si  era 
verdad  que  en  el  mundo  entero  sólo  había  cuatro  personas  que  entendían  la  teoría  de  la  relati- 
vidad general.  Eddington  se  quedó  pensativo  durante  unos  momentos  y respondió:  "Me  estoy 
preguntando  quién  podría  ser  el  cuarto." 

Aunque  es  posible  que  la  anécdota  sea  históricamente  correcta,  la  afirmación  de  Eddington 
ciertamente  no  lo  era,  ni  ahora,  ni  entonces.  Prueba  de  ello  es  la  gran  cantidad  de  físicos  que  se 
han  puesto  a trabajar  en  la  relatividad  general  y el  número  de  soluciones  que  fueron  halladas 
en  los  años  inmediatamente  después  de  la  publicación  de  la  teoría  en  1915:  la  acción  de  Hilbert 
(1915),  los  agujeros  negros  de  Schwarzschild  (1916)  y Reissner-Nordstróm  (1916  y 1918),  los  espa- 
cios de  De  Sitter  y anti-De  Sitter  (1916  y 1917),  la  clasificación  cosmológica  de  Friedmann  (1922), 
la  onda  gravitacional  de  Brinkmann  (1923),  la  compactificaciones  de  Kaluza  y Klein  (1921  y 1926), 


Aún  así  la  teoría  de  la  relatividad  siempre  ha  tenido  fama  de  contraintuitiva  y tremendamen- 
te dificil.  Esta  fama,  en  mi  opinión,  es  solamente  justificada  hasta  cierto  punto.  La  teoría  de  la 
relatividad  especial  forma  parte  del  curriculum  estándar  de  cualquier  estudiante  de  física  en  los 
primeros  años  de  la  carrera.  La  relatividad  general  es  más  dificil  y la  suelen  estudiar  sólo  los 
estudiantes  especializándose  en  física  teórica. 

Sin  embargo,  conviene  distinguir  dos  partes  dentro  de  la  relatividad  general:  una  parte  física, 
que  describe  las  ideas  básicas  de  la  teoría,  y una  parte  matemática,  que  nos  da  el  formalismo  con 
el  cual  describir  la  física.  La  dificultad  de  la  relatividad  general  está  en  la  parte  matemática,  ya 
que  contiene  análisis  tensorial  y geometría  diferencial,  temas  que  el  típico  estudiante  de  física 
no  encuentra  en  su  curriculum  sino  para  estudiar  relatividad  general.  Por  otro  lado,  la  parte 
física  es  relativamente  sencilla,  no  siendo  en  el  fondo  nada  más  que  llevar  hasta  sus  últimas 
consecuencias  lógicas  unos  pocos  principios  básicos.  Según  Rutherford  "una  buena  teoría  física 
se  le  puede  explicar  a una  camarera  en  un  bar".  En  mi  opinión  (la  parte  física  de)  la  relatividad 
general  satisface  esta  condición  (con  suficiente  tiempo  disponible). 

En  este  curso  he  intentado  mantener  el  equilibrio  entre  estas  dos  partes,  puesto  que  creo  que 
las  dos  son  igual  de  importantes:  sin  la  matemática  es  imposible  alcanzar  un  nivel  que  vaya  más 
allá  de  los  numerosos  libros  de  popularización  sobre  relatividad.  Por  otro  lado,  sin  la  parte  físi- 
ca uno  estaría  haciendo  básicamente  geometría  diferencial  a un  nivel  que  lo  podía  haber  hecho 
Riemann  en  el  siglo  XIX  y se  perdería  unos  profundos  principios  sobre  la  equivalencia  de  obser- 
vadores y la  estructura  del  espacio  y el  tiempo. 

La  teoría  de  la  relatividad  es,  junto  con  la  mecánica  cuántica,  uno  de  los  dos  pilares  de  la 
física  del  siglo  XX.  Cualquier  teoría  que  pretenda  ser  fundamental  debería  tomar  en  cuenta  estos 
dos  pilares.  Pero  hay  dos  razones  que  hacen  que  la  teoría  de  la  relatividad  sea  históricamente 
diferente  de  la  mecánica  cúantica,  incluso  de  la  teoría  cúantica  de  campos. 

La  primera  razón  es  que  la  teoría  de  la  relatividad  fue  esencialmente  el  trabajo  de  una  sola  per- 
sona. Donde  la  mecánica  cúantica  fue  desarrollado  por  gente  como  Bohr,  de  Broglie,  Heisenberg, 
Schródinger,  Pauli,  etc,  en  partes  más  o menos  igual  de  importantes,  la  teoría  de  la  relatividad  es 
el  fruto  (casi)  únicamente  de  Albert  Einstein,  además  en  un  periodo  de  unos  10  años,  entre  1905 
y 1916. 

La  segunda  razón  que  hace  que  la  teoría  de  la  relatividad  ocupe  un  lugar  especial  en  la  físi- 
ca es  que  fue  desarollada  por  razones  puramente  teóricas,  no  para  dar  una  explicación  a unos 
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resultados  experimentales  nuevos.  Muchas  veces  se  dice  que  la  relatividad  especial  fue  desaro- 
llada  para  explicar  el  resultado  nulo  de  los  experimentos  de  Michelson  y Morley,  pero  esto  no  es 
históricamente  correcto.  Einstein  mismo  siempre  ha  dicho  que  en  1905  no  sabía  de  los  resultados 
de  Michelson.1 

El  verdadero  punto  de  partida  de  Einstein  era  la  incompatibilidad  de  la  mecánica  newtoniana, 
la  teoría  de  Maxwell  y el  principio  de  la  relatividad  de  Galilei.  La  mecánica  newtoniana  y la  teoría 
de  Maxwell  tienen  grupos  de  simetría  diferentes,  mientras  el  principio  de  la  relatividad  dice  en 
grandes  líneas  que  todas  las  teoría  físicas  deberían  tener  el  mismo  grupo.  La  solución  de  Einstein 
a este  problema  teórico,  la  teoría  de  la  relatividad  especial,  es  una  reformulación  de  la  mecánica 
newtoniana  en  términos  del  grupo  de  Lorentz,  el  grupo  de  simetría  de  la  teoría  de  Maxwell.  De 
paso  la  relatividad  especial  nos  proprociona  una  nueva  manera  de  pensar  sobre  la  estructura  del 
espacio  y el  tiempo. 

También  la  motivación  para  la  relatividad  general  fue  puramente  teórica:  Einstein  se  dió  cuen- 
ta de  que  la  teoría  de  la  gravedad,  tal  como  fue  propuesta  por  Newton,  no  era  compatible  con  la 
estructura  del  espacio  y el  tiempo  que  surge  de  la  relatividad  especial.  Einstein  formuló  una  nue- 
va versión  de  la  gravedad,  que  esencialmente  convierte  la  gravedad  newtoniana  en  una  teoría 
de  campos,  un  concepto  introducido  por  Faraday  y Maxwell  unos  50  años  antes.  La  interacción 
gravitatoria  ya  no  es  instantánea  y a distancia,  sino  a través  de  un  campo  intermediario  por  el 
cual  la  fuerza  gravitatoria  se  propaga  con  velocidad  finita.  Lo  revolucionario  de  la  relatividad  ge- 
neral es  la  identificación  de  este  campo  intermediario  con  la  métrica,  un  objeto  matemático  que 
describe  las  propiedades  geométricas  del  espacio.  La  relatividad  general  induce  por  lo  tanto  una 
profunda  relación  entre  la  gravedad  y la  curvatura  del  espaciotiempo. 

De  este  modo  la  teoría  de  la  relatividad  no  es  sólo  una  teoría  moderna  de  la  gravedad,  mejo- 
rando la  gravedad  newtoniana,  sino  también  nos  enseña  unas  lecciones  en  la  frontera  entre  física 
y metafísica.  Primero,  por  un  lado  la  relatividad  especial  ha  eliminado  los  conceptos  del  espacio 
absoluto,  del  tiempo  absoluto  y de  la  velocidad  absoluta,  por  no  ser  observables,  mientras  por 
otro  lado  la  relatividad  general  ha  incorporado  en  la  física  el  concepto  del  espaciotiempo  dinámi- 
co, como  una  entidad  física,  igualmente  real  que  conceptos  como  masa,  carga,  energía  o momento 
angular.  El  espaciotiempo  ha  pasado  de  ser  un  escenario  estático  donde  ocurre  la  física  a ser  una 
parte  más  de  la  física  que  influye  lo  que  contiene  y puede  ser  influenciado  por  ello. 

Y la  segunda  lección  que  nos  enseña  la  teoría  de  la  relatividad  es  que  una  buena  teoría  física 
tiene  que  hacer  algo  más  que  simplemente  reproducir  las  observaciones  o los  datos  experimenta- 
les de  un  observador.  Debería  poder  escribir  los  datos  experimentales  de  cualquier  observador  y 
si  distintos  observadores  están  relacionados  por  ciertas  transformaciones  de  simetría,  entonces  la 
teoría  debería  reflejar  estas  simetrías  y tomar  una  forma  tal  que  es  invariante  bajo  estas  transfor- 
maciones. En  otras  palabras,  la  teoría  de  la  relatividad  nos  enseña  la  forma  en  que  de  debemos 
formular  una  teoría  física  para  poder  tomarla  en  serio. 

No  es  de  extrañar  que  la  teoría  de  la  relatividad  sea  una  de  los  pilares  fundamentales  de  la 
física  conocida. 


1 Aunque  esto  tampoco  es  verdad:  existen  pruebas  de  que  lo  había  discutido  en  varias  ocasiones  en  su  grupo  de  amigos 
físicos. 
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Capítulo  1 

Breve  repaso  de  la  teoría  de  Maxwell 


La  teoría  de  la  relatividad  especial  debe  su  origen  a las  ecuaciones  de  Maxwell  del  campo 
electromagnético. 

(A.  Einstein) 


La  teoría  de  Maxwell  de  las  interacciones  electromagnéticas  siempre  ha  tenido  una  relación 
muy  estrecha  con  la  teoría  de  la  relatividad.  Aunque  data  de  unos  40  años  antes  de  que  Eins- 
tein presentara  su  relatividad  especial,  ya  llevaba  algunas  de  las  características  de  ésta,  como  la 
velocidad  de  la  luz  como  una  velocidad  absoluta  y la  invariancia  bajo  las  transformaciones  de  Lo- 
rentz.  La  teoría  de  Maxwell  encaja  tan  extraordinariamente  bien  en  la  relatividad  especial  y con 
unas  ligeras  modificaciones  en  la  relatividad  general,  que  servirá  en  numerosas  ocasiones  como 
ejemplo  concreto  o caso  de  prueba  de  técnicas  que  encontramos  a lo  largo  de  este  curso.  Por  lo 
tanto  merece  la  pena  repasar  brevemente  los  aspectos  más  importantes  de  la  teoría  de  Maxwell 
en  lenguaje  tridimensional. 


1.1.  El  límite  a sistemas  continuos 

La  teoría  de  Maxwell  es  una  teoría  de  campos,  es  decir  una  teoría  con  infinitos  grados  de  li- 
bertad. El  concepto  de  un  campo  físico  fue  introducido  por  Michael  Faraday  (1791-1869),  que 
había  observado  que  el  serrín  metálico  se  agrupaba  según  filamentos  en  la  proximidad  de  car- 
gas eléctricas  e imanes.  Faraday  se  imaginaba  que  las  cargas  y los  imanes  generaban  campos 
eléctricos  y magnéticos  que  se  extendían  por  el  espacio  y que  éstos  actuaban  a su  vez  sobre  otras 
cargas  e imanes.  De  esta  manera,  Faraday  consiguió  eliminar  el  problema  de  la  acción  a distan- 
cia, tan  típico  de  la  gravedad  newtoniana  y la  ley  de  Coulomb,  que  postula  que  las  interacciones 
físicas  se  manifiestan  instantáneamente  a distancias  arbitrariamente  grandes,  sin  preocuparse  de 
la  pregunta  de  cómo  se  propagan  estas  influencias.  En  una  teoría  de  campos,  como  la  teoría  de 
Maxwell,  las  distintas  partículas  no  interacciones  direcamente  entre  ellas,  sino  usan  los  campos 
como  los  transportadores  de  las  interacciones  físicas:  una  perturbación  de  una  carga  eléctrica  ge- 
nera una  perturbación  en  el  campo  electromagnético,  que  a su  vez  se  propaga  a velocidad  finita 
(la  velocidad  de  la  luz)  por  todo  el  espacio.  Las  demás  cargas  en  el  universo  sólo  notan  la  influen- 
cia de  la  perturbación  original,  cuando  la  perturbación  del  campo  electromagnético  haya  llegado 
hasta  ellas.  En  este  sentido  un  campo  físico  es  realmente  un  intermediario  a través  del  cual  las 
distintas  partículas  interacciónan  sobre  grandes  distancias.  Hoy  en  día,  las  teorías  de  campos  for- 
man la  base  de  la  física  moderna:  toda  la  física  de  partículas  está  basada  en  la  teoría  cuántica  de 
campos,  mientras  en  cierto  modo  la  relatividad  general  no  es  más  que  una  reformulación  de  la 
gravedad  newtoniana  en  lenguaje  de  una  teoría  de  campos. 
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a-1  k a k a+1 

m rfi  m 


\fK+yK^\/\i+Áfl Ét*LA 


Figura  1.1:  Una  serie  de  masas  m están  conectadas  a través  de  muelles  con  constante  k y posición  de 
equilibrio  L0.  En  la  situación  de  equilibrio  (arriba)  las  masas  están  separadas  por  la  distancia  L0.  En  la 
situación  general  (abajo)  el  desplazamiento  de  la  masa  m de  la  posición  de  equilibrio  está  caracterizado  por 

4*o¿  • 


Conceptualmente  las  teorías  de  campos  son  un  poco  diferentes  que  los  sistemas  discretos.  Por 
lo  tanto  es  útil  estudiar  la  conexión  con  la  mecánica  analítica  discreta,  antes  de  tratar  a fondo  el 
electromagnetismo.  Desde  el  punto  de  vista  mecánico,  una  teoría  de  campos  no  es  nada  más  que 
una  teoría  con  un  número  infinito  (continuo)  de  grados  de  libertad.  Son  aplicables  por  lo  tanto 
las  mismas  técnicas  que  ya  conocemos  de  (por  ejemplo)  el  formalismo  lagrangiano,  solamente 
tomando  en  cuenta  la  sutileza  de  tomar  de  manera  adecuada  el  límite  continuo.  En  esta  sección 
revisaremos  cómo  tomar  este  límite. 

Consideramos  un  sistema  que  consiste  de  una  serie  infinita  (pero  contable)  de  masas  iguales 
alineadas  a lo  largo  del  eje  x y conectadas  por  muelles  idénticos  de  tamaño  Lq  y constante  elástica 
k.  Supondremos  además  que  las  masas  sólo  se  pueden  mover  en  la  dirección  x (Véase  Figura  1.1). 
Tomamos  como  coordenadas  generalizadas  qa ( t ) la  posición  de  la  o-ésima  masa  m 

qa(t)  = aL0  + (/)a(t),  (1.1) 


donde  el  indice  «£Z  corre  de  -oo  a oo  y 0n(t)  mide  la  desviación  de  la  posición  de  equilibrio. 
Las  velocidadas  generalizadas  por  lo  tanto  vienen  dadas  por  qa  = <¡)a.  La  energía  potencial  es 
proporcional  al  cuadrado  de  la  desviación  de  los  muelles  del  tamaño  de  equilibrio  y viene  dada 
por 

V = Í - da-  L0)2  = fc(^a  + l “ ^ocf  ■ (1-2) 

Oí  Oí 

Podemos  por  lo  tanto  escribir  el  lagrangiano  como 


L 


\ - <t>a)2 

a oí 


(1.3) 


donde  en  la  última  igualdad  hemos  sacado  un  factor  Lo  por  razones  que  se  harán  claras  un  poco 
más  adelante.  Las  ecuaciones  de  movimiento  vienen  dadas  por 


T 0o:  — kLo 
-^o 


/ 4*Oí-\-l  4*Oí  \ 

V Lg  / 


- kLo 


( 


(j>Oí 


~ 0CK-1  \ 

I2—)- 


(1.4) 


Aquí  no  estamos  interesados  en  intentar  resolver  estas  ecuaciones,  sino  queremos  saber  qué  ocu- 
rre con  el  lagrangiano  y la  ecuaciones  de  movimiento  en  el  límite  donde  la  posición  de  equilibrio 
L0  tiende  a cero. 
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Una  primera  observación  es  que  en  este  caso  la  distribución  de  masas  se  hace  continua  y el 
sistema  de  masas  conectadas  por  muelles  tiende  a una  varilla  elástica  con  cierta  densidad  de 
masa  p.  El  índice  discreto  a que  hace  referencia  a la  a-ésima  masa,  se  convierte  en  una  variable 
continua  x,  indicando  los  puntos  a lo  largo  de  la  varilla.  Concretamente,  la  coordenada  genera- 
lizada fia(t)  que  indica  el  desplazamiento  de  la  masa  a se  convierte  en  una  función  <j>(x ,t)  del 
desplazamiento  de  una  cantidad  infinitesimal  de  masa  dm  a lo  largo  de  la  recta. 

De  este  modo  hemos  pasado  de  una  teoría  con  un  número  discreto  de  grados  de  libertad 
a una  teoría  con  un  número  continuo  de  grados  de  libertad.  En  otras  palabras,  una  teoría  de 
campos.  Nótese  que,  a pesar  de  que  fi(x,  t ) es  una  función  de  x y de  t sin  que  ninguna  de  los  dos 
variables  juegue  un  rol  más  fundamental  que  el  otro,  el  origen  de  cada  uno  de  las  variables  es 
muy  distinto.  Merece  la  pena  enfatizar  que  en  el  límite  de  teoría  de  campos,  las  cantidades  físicas 
fundamentales,  las  que  juegan  el  papel  de  coordenada  generalizada,  son  los  campos  fi(x,  t)  y no 
las  posiciones  x.  Las  posiciones  x no  son  en  cierto  modo  más  que  una  etiqueta  continua  para 
distinguir  los  diferentes  grados  de  libertad  fi. 

Miremos  ahora  cómo  se  transforman  el  lagrangiano  (1.3)  y las  ecuaciones  de  movimiento 
(1.4)  en  el  límite  L0  — > 0.  Está  claro  que  en  este  caso  las  cantidades  én(t)  y (fifit)  se  convierten  en 
derivadas  parciales  con  respecto  al  tiempo: 

fia(t) — * di^x,*),  fia(t) — * -Qp<j>{x,t).  (1.5) 

Además,  el  segundo  término  de  (1.3)  es  prácticamente  por  definición  la  derivada  parcial  con 
respecto  a x (ésta  es  la  razón  por  haber  sacado  el  factor  L0  antes). 


fia+l(t)  ~ <¡>a(t)  fi{x  + L0,t)  - fi(x,t) 

lim  = lim  

Lq— L o Lq—>o  L o 


dx 


fi(x,t) 


(1.6) 


y consecuentemente  los  términos  del  lado  derecho  de  (1.4)  se  convierten  en  una  derivada  segun- 
da: 


f 0QÍ+1  4^ Oí  ^ 

l-l 

f 4*01.  4oí— i ^ 

— 1 1 m 

~dfi(x  + L0,t)  dfi(x,t)~ 

d2fi(x,t) 

L2  ) 

i Lq  ) 

— lliil  

Lq—>0  Lq 

dx  dx 

dx2 

(1.7) 


Queda  por  lo  tanto  identificar  el  límite  de  los  parámetros  que  aparecen  en  el  lagrangiano  y la 
ecuación  de  movimiento.  La  cantidad  m/ Lq  tiene  dimensión  de  masa  por  unidad  de  longitud,  y 
en  el  límite  continuo  se  convierte  en  la  densidad  p de  la  varilla.  La  cantidad  kLi,  se  identifica  de 
la  siguiente  manera:  la  fuerza  necesaria  para  extender  uno  de  las  muelles  la  distancia  (<¡>a+i  ~ ha) 
viene  dada  por 

F = k{fia+1  - fia)  = kL0  = yAL0,  (1.8) 

donde  ALo  = (fia+i  — fia) /Lo  es  la  extensión  por  unidad  de  longitud  y Y es  el  módulo  de  Young, 
la  constante  de  proporcionalidad  entre  la  fuerza  aplicada  y la  extensión  por  unidad  en  materiales 
elásticas,  una  constante  que  depende  del  material  considerado. 


Con  esta  identificación  de  la  densidad  y el  módulo  de  Young  podemos  escribir  el  lagrangiano 
(1.3)  como 

L = í dx[±p(dtfi)2  - \Y(dxfi)2],  (1.9) 


donde  la  suma  sobre  los  desplazamientos  -^o  se  ha  convertido  en  una  integral  f dx  sobre 
la  variable  continua  x.  Del  mismo  modo,  la  ecuación  de  movimiento  (1.4)  se  convierte  en  una 
ecuación  de  ondas 


pd?fi{x,t)  - Y d2fi(x,  t)  = 0, 


(1.10) 


que  describe  ondas  (longitudinales)  de  densidad  en  el  material  de  la  varilla  que  se  propagan  con 
una  velocidad  v = \fY/p. 
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Podemos  escribir  esta  integral  como  L = f dxC,  donde  el  integrando  Ció,  0xé.  0tó)  es  la 
densidad  lagrangiana,  que  contiene  toda  la  física  del  sistema.  A su  vez  se  define  la  acción  S como 


S{(j>,dx(j),dt(t>) 


dt  L(<j>,dx<j>,dt(j)) 


J dtdx  C{(¡>,  dx(f>,  dt4>). 


(1.11) 


Nótese  que  hemos  tenido  mucho  cuidado  en  derivar  el  límite  continuo  de  tanto  el  lagrangiano 
(1.10)  como  las  ecuaciones  de  movimiento  (1.9),  sin  decir  todavía  nada  sobre  cómo  derivar  las 
ecuaciones  de  movimiento  del  lagrangiano.  En  principio  no  es  muy  diferente  a la  derivación 
estándar  de  la  mecánica  analítica  con  variables  discretas,  salvo  que  ahora  hay  que  variar  con 
respecto  a los  campos  ó(x,  t),  es  decir,  a variables  continuas.  La  herramienta  matemática  necesaria 
para  esta  operación  es  la  derivada  funcional,  definida  como 


8<¡>(x',t')  . , SF(</)(x\t'))  _ dF(f(x',t'))  Sf(x',t') 

8<f>(x,t)  ' ’ 5<j>(x,t ) d(j)(x',t')  5<j>(x,t) 

para  cualquier  función  F{(j>{x,  t ))  y donde  8(x  — x')  es  la  delta  de  Dirac. 

La  variación  de  (1.11)  con  respecto  a los  campos  <f>(x,  t)  viene  entonces  dada  por 


0 = 8S  = 


SC((¡){x,  t),  dxc¡)(x,  t),  dtfjx,  t)) 
8<j>(x' , t') 

6£(4>(x,  t),  dxcj)(x,  t ),  dtf{x,  t )) 
5dx'(t>{xit') 

5C((¡>(x,  t),  dxf(x,  t ),  dt<j)(x,  t)) 
Sdt>(¡){x' ,t') 


64>(xr , t') 

5dX'(¡)(x'  ,t') 
Sdty(/)(x' ,t') 


(1.12) 


(1.13) 


Igual  que  en  el  caso  de  variables  discretas,  podemos  suponer  que  Sdxxj)(x',  t')  = dx’5(¡){x' , t'), 
de  modo  que  integrando  por  partes  los  últimos  dos  términos  e imponiendo  las  condiciones  de 
contorno 

8(j>{x,ti)  = 5<j){x,tf)  = 8(¡>{x\,t)  = 8(¡>{x2,t)  = 0,  (1.14) 

(es  decir,  tomando  la  variación  igual  a cero  tanto  en  los  puntos  iniciales  y finales  como  en  los 
contornos1),  tenemos  que  la  variación  toma  la  forma 


0 = SS  = 


í r d 

1 dtdx  w 

í 1 

d , 

| _| 

í 1 

8C  i 

1 

\5(dt(t>{x,t))) 

! 1 TJ  1 

OX 

\8{dx(j>{x,t)) ) 

8<J)(x,t)- 

8<t>(x,t), 


(1.15) 


lo  que  por  el  cálculo  variacional  sólo  es  cero  si  está  satisfecha  la  ecuación  de  Euler-Lagrange  para 
una  teoría  de  campos: 


( 6C  ) 

d 

_| 

( 6C  ] 

8C 

OX 

Ks(dxf)J 

(1.16) 


Concretamente  para  el  caso  de  la  acción  (1.9)  tenemos  que 

5CÍ(t>{x' , t'),  dx<(f{x' , t'),  dt'(¡){ x',  t')] 

- = p dt>(/)(x',  t')8(x  — x')8(t  — t')  = p dtcj)(x,  t),  (1.17) 

= Ydxf(x',t')5(x  — x')5(1:,  — t')=Y  dx(j)(x,t),  (1.18) 

tal  que  (1.16)  aplicado  al  lagrangiano  (1.9)  implica  la  ecuación  de  movimiento  (1.10),  como  hemos 
derivado  antes  calculando  el  límite  explícitamente. 

JEn  el  caso  de  la  varilla  elástica  hemos  tomado  xi  = — oo  y X2  = oo,  pero  en  general  la  integración  se  puede  hacer 
tanto  en  intervalos  finitos  como  infinitos. 


5{dtf(x,t)) 

5c(f{x' , t'),  dx'(f>(x i t'),  dt>(/){x',  í')) 
8(dx'<j>(x,t)) 
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En  la  práctica,  las  derivadas  funcionales,  por  muy  complicadas  que  parezcan,  se  aplican  como 
si  fueran  derivadas  ordinarias,  olvidándose  de  que  uno  en  realidad  está  derivando  con  respecto 
a funciones.  Omitiendo  la  dependencia  funcional,  podemos  por  lo  tanto  reducir  (1.17)  y (1.18)  a 


SC 


pdt<t>, 


SC 

S{dx(¡) ) 


Y dx(¡>. 


(1.19) 


La  generalización  de  todo  el  formalismo  a dos  y tres  dimensiones  debería  ser  obvia.  En  lugar 
de  ser  funciones  de  sólo  x y t,  los  campos  4>(xl , t)  van  a depender  en  general  de  xl  y t y el  lagran- 
giano  será  una  función  de  t)  y sus  derivadas  dj<p(x\  t)  y La  ecuación  de  Lagrange 

(1.16)  será  por  lo  tanto  de  la  forma 


d í SC  \ ^ d í SC  \ SC 

dt\S(dt<f>))  ^ dxi\S(di(¡)))  5<¡) 


(1.20) 


1.2.  Las  leyes  de  Maxwell 

El  físico  escocés  James  Clerk  Maxwell  (1831-1879)  publicó  sus  cuatro  leyes  de  Maxwell  en 
1865,  aunque  la  mayoría  de  estas  leyes  ya  habían  sido  descubiertos  por  Charles- Augustin  Coulomb 
(1736-1806),  Hans  Christan  0rsted  (1777-1851),  André-Marie  Ampére  (1775-1836),  Jean-Baptiste 
Biot  (1774-1862),  Félix  Savart  (1791-1841)  y Faraday  (1791-1867)  a base  de  investigación  experi- 
mental. De  hecho  Maxwell  añadió  sólo  un  término  nuevo  a las  ecuaciones  que  ahora  llevan  su 
nombre.  Pero  el  gran  logro  de  Maxwell  fue  unificar  el  conjunto  de  leyes  empíricas  sueltas  sobre 
electrostática,  corrientes  eléctricas  e inducción  magnética  en  una  sólida  teoría  que  describe  todos 
los  fenómenos  relacionados  con  el  electromagnetismo.  Y como  extra  resultó  que  su  teoría  era  ca- 
paz de  dar  un  fundamento  teórico  a la  óptica,  una  parte  de  la  física  que  hasta  entonces  parecía 
completamente  disconexa  de  los  fenómenos  electromagnéticos. 

Dada  una  densidad  de  cargas  eléctricas  p(x,  t)  y una  densidad  de  corriente  j (x.  t),  las  leyes 
de  Maxwell  para  los  campos  eléctricos  E(x,  t)  y magnéticos  B(x,  t ) vienen  dadas,  en  unidades  de 
Lorentz-Heaviside,2  en  la  siguiente  forma 


v • E = p, 

(1.21) 

V x É = — - dtB, 

(1.22) 

c 

V-B  = 0, 

(1.23) 

1 1 

VxB  = -j  - 1-  - dtE, 

(1.24) 

donde  c es  la  velocidad  de  la  luz. 

Las  ecuaciones  de  Maxwell  en  forma  diferencial  (1.21)-(1.24)  consiste  en  8 ecuaciones  dife- 
renciales lineales  acopladas,  donde  en  general  se  toma  como  condiciones  de  contorno  que  los 
campos  E y B tienden  a cero  en  el  infinito  (para  sistemas  infinitos).  Aunque  la  forma  diferencial 
(1.21)-(1.24)  es  más  conveniente  para  buscar  soluciones  de  las  ecuaciones,  la  física  detrás  de  estas 
ecuaciones  se  ve  mejor  en  la  formulación  integral.  Utilizando  los  teoremas  de  Stokes  sobre  las 
integrales  de  la  divergencia  y el  rotacional  de  un  campo  vectorial  A 

JV'ld3!  = (fj>  Á-ñd2x,  íí  (V  x Á)  ■ n d2x  = Á-dr,  (1-25) 

v JJdV  JJ  s J dS 

2Las  unidades  de  Lorentz-Heaviside  es  un  convenio  donde,  a diferencia  de  las  unidades  SI,  la  permitividad  eléctrica 

cq  y la  permeabilidad  magnética  p o del  vacío  no  aparecen  explícitamente.  Tiene  la  ventaja  que  el  único  parámetro  físico 
que  aparece  en  las  ecuaciones  de  Maxwell  es  la  velocidad  de  la  luz  c. 
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Figura  1.2:  La  primera  y la  tercera  ley  de  Maxwell:  el  flujo  del  campo  eléctrico  É a través  de  una  superficie 
cerrada  es  proporcional  a la  carga  total  encerrada  dentro  de  la  superficie,  mientras  que  el  flujo  del  campo 
magnético  B a través  de  cualquier  superficie  cerrada  es  cero. 


podemos  reescribir  las  ecuaciones  de  Maxwell  (1.21)-(1.24)  en  su  forma  integral: 


(ff  É-nd2x  = fff  pd3x,  (1-26) 

JJ  ov  JJJv 

f É ■ dr  = —--7-  ff  B-ñdfx,  (1.27) 

Jos  c dt  JJs 

ff  §-nd2x  = 0,  (1.28) 

JJdV 

d f B ■ dr  = - ff  j-  n d2x  + ff  É ■ ñ d2x.  (1.29) 

Jas  c JJS  c dt  JJS 


La  primera  ley  de  Maxwell  o la  Ley  de  Gauss  (1.26)  nos  dice  que  el  flujo  del  campo  eléctrico  a 
través  de  una  superficie  cerrada  es  igual  a la  carga  total  encerrada  dentro  de  la  superficie.  No  es 
nada  más  que  una  versión  del  teorema  de  Gauss  sobre  flujos  de  campos  vectoriales,  aplicada  a 
E,  identificando  la  carga  eléctrica 


Q = 


J pd3x 


(1.30) 


como  fuente  del  campo  eléctrico.  En  particular,  si  tomamos  el  caso 

de  una  carga  puntual  q en  el  origen,  podemos  calcular  el  flujo  de  E a través  de  una  esfera  de 
radio  Rq  alrededor  del  origen.  Aprovechándonos  de  la  simetría  esférica  del  problema  es  fácil  de 
ver  que  (ejerc.) 

É = ¿í 

con  lo  que  hemos  recuperado  la  ley  de  Coulomb  . 

La  tercera  ley  de  Maxwell  (1.28)  nos  intenta  dar  el  equivalente  magnético  de  la  ley  de  Gauss. 
Sin  embargo  aquí  vemos  que  el  lado  derecho  de  la  ecuación,  que  correspondería  al  término  de  la 
fuente  del  campo  magnético,  es  cero.  La  ecuación  (1.28)  dice  que  el  flujo  magnético  a través  de 
cualquier  superficie  cerrada  siempre  es  cero.  En  otras  palabras,  no  existe  un  equivalente  magnéti- 
co de  una  carga  eléctricaMientras  que  las  cargas  eléctricas  positivas  y negativas  pueden  existir 
separadas  e independientes  unas  de  otras,  los  polos  norte  y sur  de  un  imán  siempre  aparecen  en 
parejas.  En  otras  palabras,  no  existen  pozos  y fuentes  para  el  campos  magnéticos  y las  lineas  de 
campo  o bien  son  cerradas,  o se  extienden  hasta  el  infinito.  Aunque  en  la  física  moderna  existen 
soluciones  de  monopolos  magnéticos  con  propiedades  muy  interesantes,  no  hay  (de  momento) 
ninguna  indicación  que  estas  soluciones  corresponden  a objetos  reales  en  la  naturaleza.  Discuti- 
remos un  ejemplo  de  una  solución  de  monopolo  en  la  sección  1.6. 
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Figura  1.3:  La  Ley  de  Ampére  y la  Ley  de  Faraday:  Una  corriente  eléctrica  a través  de  una  superficie 
genera  un  campo  magnético  a lo  largo  de  la  curva  que  borde  la  superficie,  mientras  que  la  variación  de  flujo 
magnético  a través  de  una  superficie  induce  una  corriente  eléctrica  a lo  largo  de  la  curva. 


Figura  1.4:  Ejemplos  típicos  de  la  Ley  de  Ampére:  un  campo  magnético  rotacional  alrededor  de  un  conduc- 
tor lineal  infinito  y un  campo  magnético  constante  en  el  interior  de  un  solenoide. 


La  Ley  de  Ampére,  el  primer  término  de  la  derecha  de  la  ecuación  (1.29),  nos  cuenta  cuál  es 
la  fuente  del  campo  magnético:  la  corriente  eléctrica  j.  La  integral  de  /i  a lo  largo  de  una  curva 
cerrada  C es  igual  al  flujo  de  corriente  eléctrica  a través  de  la  superficie  cuyo  contorno  es  la  curva 
C (Véase  Figura  1.3a).  En  particular  podemos  distinguir  dos  casos  de  interés.  El  primero  es  el 
caso  del  conductor  lineal  infinito  con  una  corriente  constante  / = f j ■ ñ d2x  (Figura  1.4a).  A 
través  de  la  ley  de  Ampérey  la  simetría  cilindrica  del  sistema  no  es  muy  difícil  de  ver  (ejerc.)  que 
el  campo  magnético  generado  por  esta  corriente  / tiene  sólo  una  componente  en  la  dirección  ip, 
el  ángulo  polar  en  coordenadas  cilindricas: 

B = J-  e„.  (1.32) 

El  segundo  caso  interesante  es  el  del  solenoide  infinito,  donde  una  corriente  I pasa  por  una 
hélice  conductor  (Figura  1.4b).  De  manera  similar  al  caso  del  conductor  lineal  se  puede  demostrar 
(ejerc.)  que  el  campo  magnético  fuera  del  solenoide  es  cero,  mientras  que  dentro  hay  un  campo 
constante  B = Iez  a lo  largo  del  eje  del  solenoide.  Una  consecuencia  de  esto  es  que  un  metal  se 
convierte  en  un  imán  si  lo  metemos  dentro  de  un  solenoide.  Dependiendo  del  tipo  de  material  es 
posible  que  las  propiedades  magnéticas  perduran  incluso  si  sacamos  el  metal  del  solenoide.  Los 
casos  aquí  comentados  son  ejemplos  sencillos  de  la  ley  de  Biot-Savart  sobre  el  campo  magnético 
generada  por  corrientes  eléctricos.  Vemos  por  lo  tanto  que  la  ley  de  Biot-Savart,  y en  general  la 
de  Ampére,  relacionan  claramente  los  fenómenos  eléctricos  con  los  fenómenos  magnéticos. 

La  Ley  de  Faraday  o la  ley  de  la  inducción  magnética  (1.27)  describe  en  cierto  sentido  la  situación 
contraria  a la  ley  de  Ampére  con  el  solenoide.  Si  una  corriente  circular  causa  un  campo  magnético, 
¿también  un  imán  metido  en  un  anillo  conductor  causa  una  corriente  eléctrica  en  el  anillo?  Esto 
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Figura  1.5:  El  término  de  Maxzvell  como  corrección  a ¡a  ley  de  Ampére:  el  campo  magnético  B alo  largo  de 
de  lina  curva  C alrededor  del  conductor  con  una  corriente  j no  es  igual  al  flujo  de  la  corriente  pasando  por 
la  superficie  S,  si  S pasa  entre  las  dos  placas  de  un  condensador.  La  carga  que  se  acumula  en  el  condensador 
crea  un  cambio  en  el  campo  eléctrico,  que  es  el  responsable  del  campo  magnético  B. 


claramente  no  es  verdad,  puesto  que  violaría  de  manera  brutal  la  conservación  de  energía.  Pero 
Faraday  descubrió  que  sí  se  genera  una  corriente  en  el  momento  en  que  el  imán  se  acerca  o se 
aleja  del  anillo,  es  decir  cuando  el  flujo  magnético  a través  del  anillo  cambia.  La  ley  de  Faraday 
dice  que  un  cambio  en  el  flujo  magnético  a través  de  una  superficie  S induce  un  campo  eléctrico 
rotacional  alrededor  de  la  curva  que  bordea  S (Véase  Figura  1.3b).  Este  campo  eléctrico  rotacional 
general  una  corriente  j que  a su  vez  causa  a través  de  la  ley  de  Ampére  un  campo  magnético.  El 
sentido  de  la  corriente  j es  tal  que  el  campo  magnético  causado  intenta  compensar  el  cambio  de 
flujo  del  campo  original.  Las  corrientes  eléctricas  inducidas  por  cambio  de  flujos  magnéticos  a 
través  de  una  superficie  son  el  principio  básico  detrás  de  una  dinamo  y forman  la  base  del  motor 
eléctrico. 

Las  cuatro  leyes  de  electricidad  y magnétismo  que  acabamos  de  comentar  arriba,  son  las  que 
eran  conocidas  en  los  tiempos  de  Maxwell.  En  ese  momento  eran  leyes  empíricas  que  describían 
bien  los  experimentos  realizados  hasta  entonces.  Sin  embargo  Maxwell  se  dió  cuenta  de  que  en 
particular  la  ley  de  Ampére  (las  ecuaciones  (1.24)  y (1.29)  sin  el  segundo  término  de  la  derecha)  no 
podía  ser  válida  siempre.  Si  aplicaremos  la  ley  de  Biot-Savart  (1.32)  al  caso  donde  una  corriente  j 
está  cargando  un  condensador,  la  corriente  genera  claramente  un  campo  magnético  B alrededor 
del  conductor.  Sin  embargo,  el  flujo  de  corriente  a través  de  una  superficie  es  cero,  si  dejamos 
que  la  superficie  pase  entre  las  dos  placas  del  condensador  (Véase  figura  1.5),  por  lo  que  la  ley 
de  Ampére  no  es  válida.  Maxwell  se  dió  cuenta  que  mientras  corría  la  corriente  eléctrica,  iba 
aumentando  la  carga  acumulada  en  el  condensador  y por  lo  tanto  aumentando  el  flujo  de  campo 
eléctrico  entre  las  dos  placas  y la  superficie.  De  allí  dedujo  Maxwell  que  ese  cambio  de  flujo 
eléctrico  inducía  el  campo  magnético  B alrededor  del  conductor,  lo  que  resulta  en  el  segundo 
término  de  (1.24)  y (1.29),  el  término  de  Maxwell.  Al  conjunto  de  la  ley  de  Ampére  y el  término  de 
Maxwell,  se  le  suele  llamar  la  ley  de  Ampére-Maxwell. 

Maxwell  introdujo  su  término  a base  de  razones  puramente  teóricas,  ya  que  en  este  momento 
no  había  ninguna  indicación  experimental  para  creer  en  la  existencia  de  una  contribución  de  este 
tipo.  Sin  embargo  el  término  resulta  ser  indispensable  para  la  conservación  de  la  carga  eléctrica 
y da  lugar  a la  existencia  de  las  soluciones  de  ondas  electromagnéticas,  un  hecho  experimental- 
mente encontrado  por  Heinrich  Hertz  (1847-1894)  alrededor  de  1890. 

Las  leyes  de  Maxwell  describen  cómo  cargas  y corrientes  eléctricas  generan  campos  eléctricos 
y magnéticos,  pero  no  hemos  dicho  todavía  cómo  una  partícula  cargada  interacciona  con  estos 
campos  electromagnéticos.  Para  esto  recurrimos  a la  fuerza  de  Lorentz.  La  fuerza  ejercida  por  un 


20 


(1.33) 


campo  É y un  campo  B sobre  una  partícula  con  carga  q viene  dada  por 


F = q^É  + 


v x B\ 
c ) ’ 


donde  v es  la  velocidad  de  la  partícula.  Vemos  que  esta  fuerza  consiste  en  dos  partes:  un  término 
eléctrico  que  básicamente  resume  la  ley  de  Coulomb  entre  dos  cargas  y un  término  que  dice  que 
la  carga  notará  el  campo  magnético  si  se  mueve  con  una  velocidad  v.  En  particular  en  un  campo 
magnético  constante,  una  carga  q con  velocidad  v perdendicular  a B se  moverá  en  círculos  de 
radio  r = mv/qB  (ejerc.).  La  fuerza  de  Lorentz  es  conservativa  en  el  caso  de  cargas  estáticas,  pero 
no  en  general,  ya  que  se  ve  fácilmente  de  las  leyes  de  Maxwell  que  V x F / 0.  Sin  embargo,  el 
segundo  término  no  realiza  ningún  trabajo  sobre  la  partícula.  Aunque  cambia  la  dirección  de  v, 
no  cambia  la  norma  y por  lo  tanto  la  energía  cinética  sigue  igual.  Efectivamente,  el  cambio  de 
energía  cinética  Ecin  de  una  partícula  en  un  campo  electromagnético  sólo  es  debido  al  campo 
eléctrico: 


d-Ecin 

dt 


= v • F = qv  • E. 


(1.34) 


1.3.  Cantidades  conservadas 


Las  mismas  leyes  de  Maxwell  indican  por  su  propia  estructura  que  existen  ciertas  cantidades 
conservadas.  Tomando  la  divergencia  de  la  Ley  de  Ampére-Maxwell  (1.24)  tenemos  que 

0 = cV  • (V  x J5)  = V • / + V • dtÉ  = V • j + dtp,  (1.35) 


donde  en  la  última  igualdad  hemos  utilizado  la  ley  de  Gauss  (1.21).  La  expresión  (1.35)  es  la  forma 
en  que  en  una  teoría  de  campos  se  expresa  una  ley  de  conservación,  en  particular  aquí  tenemos 
la  ley  de  conservación  de  carga  eléctrica.  En  la  formulación  integral  se  lee 


(1.36) 


En  otras  palabras,  el  cambio  de  carga  en  un  volumen  V es  igual  al  flujo  de  corriente  que  pasa 
por  la  superficie  que  bordea  el  volumen  V.  Si  tomamos  para  el  volumen  V el  universo  entero, 
vemos  que  la  carga  total  en  el  universo  Q = / p d3x  está  conservada,  ya  que  por  definición  no 
hay  flujo  de  corriente  eléctrica  a través  de  "la  frontera  de  universo".  Pero  la  ley  de  conservación 
en  su  forma  (1.35)  ó (1.36)  es  más  fuerte  que  una  tradicional  ley  de  conservación  global,  por  su 
carácter  local.  No  sólo  nos  dice  que  la  carga  eléctrica  está  conservada,  sino  también  nos  dice  cómo 
está  conservada,  en  el  sentido  que  indica  a donde  ha  ido  la  parte  que  falta:  la  posible  pérdida 
de  carga  es  debido  al  flujo  de  corriente  eléctrica  a través  de  la  frontera.  Nótese  que  para  poder 
derivar  esta  ley  de  conservación  de  carga  hemos  utilizado  explícitamente  el  término  de  Maxwell 
en  (1.24). 


Por  (1.34)  sabemos  que  el  campo  eléctrico  puede  cambiar  la  energía  cinética  de  una  partícula 
cargada.  Si  creemos  en  la  ley  de  conservación  de  la  energía,  debemos  por  lo  tanto  acceptar  que 
el  campo  electromagnético  también  tiene  energía,  que  pierde  o gana  al  aumentar  o disminuir 
la  energía  de  la  partícula.  Esto  tampoco  resulta  tan  raro,  puesto  que  si  consideramos  el  campo 
electromagnético  como  una  realidad  física,  no  es  de  extrañar  que  posea  propiedades  físicas  como 
energía  o momento. 

Podemos  derivar  la  expresión  para  la  energía  del  campo  electromagnético  de  las  propias  leyes 
de  Maxwell.  Si  tomamos  el  producto  escalar  de  (1.24)  con  E y de  (1.22)  con  B tenemos 

L(VxB)  = -j-É+-É-dtÉ, 
c c 

B-(VxÉ)  = -[-B  ■ dtB  (1.37) 
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Restando  estas  dos  expresiones  y utilizando  que  V • (A  x B)  - ¡i  ■ VxA  - A ■ X¡  x ¡i  para 
cualesquiera  dos  vectores  Ay  B,  vemos  que 

cV  ■ (É  x B)  = -i  dt(E2  + B2)  - j- É 

= -\jt{E2+B2)  - J2<laVa-É 

a 

= -\^dt(E2  + B2)  - jtEcin,  (1.38) 

donde  en  la  segunda  igualdad  hemos  escrito  la  corriente  j como  el  conjunto  de  cargas  en  movi- 
miento y en  la  última  igualdad  hemos  utilizado  (1.34).  La  expresión  tiene  la  forma  de  una  ley  de 
conservación:  si  identificamos  las  cantidades 

Eeia=^(E2 + B2),  S = c(É  x B),  (1.39) 

con  la  energía  del  campo  electromagnético  y con  el  flujo  de  energía  respectivamente,  vemos  que 
la  ley  de  conservación  de  energía  dice  que  el  cambio  de  energía  cinética  de  las  partículas  cargadas 
más  el  cambio  de  energía  de  campo  electromagnético  en  un  volumen  es  igual  al  flujo  de  energía 
a través  de  la  superficie: 

4-^cin  + dtEem  + V-S  = 0.  (1.40) 

at 

El  vector  S = c(E  x B)  se  llama  el  vector  de  Poynting,  llamado  por  John  H.  Poynting  (1852  - 1914), 
un  estudiante  de  Maxwell,  que  derivó  esta  ley  de  conservación  de  energía  en  1884. 

Para  obtener  una  expresión  para  el  momento  podemos  hacer  una  derivación  parecida.  Lo 
más  cómodo  es  hacer  la  derivación  en  componentes.  Tomando  en  cuenta  que  en  componentes  el 
producto  vectorial  de  dos  vectores  Ay  B se  escribe  como 

3 

(A  x B)i  = 'y  j e¿ jkAjBk,  (1-41) 

j,k=  i 


donde  Cijk  es  el  símbolo  de  Levi-Civita 

1 cuando  ( ijk ) es  una  permutación  par  de  (123), 

— 1 cuando  (ijk)  es  una  permutación  impar  de  (123),  (1-42) 

0 en  todos  los  demás  casos, 

entonces  vemos  que  la  derivada  parcial  de  la  componente  i del  vector  de  Poynting  con  respecto 
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del  tiempo  viene  dado  por 


4 dtSi 

cA 


- 7 £ 


^ijk 


EjdtBk  + dtEjBk 


j,k= i 

3 


— ^ ' f-  ijk  y Ej  ^ ' C/,:/m  d/  Em  ^ ' Cjlm^l  Brrl  jj ) Bk 

j,k=  1 


Z,m=l 


Z,m=l 


1 

^ ' |^— EjdiEj  + EjdjEi  + BkdkBi  — B^diB^  — —tijkjjBk 
i,fc= i 


3 1 i 

^ — dí(E2  + _B“)  + dj(EiEj  + BiBj ) — EidjEj  — BidjBj e¿jfcJj-Sfc 


i,fc=i 
3 


1 1 

^ ' dj  |^—  — {E2  + B2)6ij  + E¿Ej  + B¿Bj  — pEi  — ^ ' —CíjkjjBk 

i— i i,fe=i 


(1.43) 


donde  en  la  segunda  igualdad  hemos  utilizado  las  ecuaciones  de  Maxwell  para  VxtíyVxBy 
en  la  última  las  ecuaciones  para  V • E y V • B,  aparte  de  la  identidad 

3 

^ ' C-ijkCimn  &jm$kn  é krnj^jn  ■ (1*44) 

¿=1 

En  los  últimos  dos  términos  de  (1.43)  reconocemos  la  expresión  para  la  fuerza  de  Lorentz  (1.33) 
de  un  conjunto  de  partículas  cargadas  y podemos  por  lo  tanto  escribirlo  como  f , = ^ ]T(j  (/)„),,  la 
derivada  del  momento  de  las  partículas.  Si  ahora  definimos  el  tensor  de  momento  electromagnético 

T,,  = (E,E,+B,B¡)-y  + B‘)},i,  (1.45) 

podemos  escribir  la  ecuación  (1.43)  como 

3 

dt  ( C~2Si  + ^ 2(Pa)i ) = - (1-46) 

a 2—1 

Vemos  por  lo  tanto  que  podemos  interpretar  el  vector  de  Poynting  como  el  momento  del  campo 
electromagnético  y la  ecuación  (1.46)  nos  dice  que  la  pérdida  de  momento  del  campo  electro- 
magnético y la  pérdida  de  momento  de  las  partículas  es  igual  al  flujo  del  tensor  de  momento  Tij. 

Nótese  que  el  vector  de  Poynting  aparece  dos  veces  en  estas  derivaciones:  una  vez  como  el 
flujo  de  energía  y otra  vez  como  el  momento  conservado.  En  la  teoría  de  la  relatividad  especial 
veremos  que  la  energía  y el  momento  están  relacionados  como  los  componentes  del  cuadrivector 
de  energía-momento.  Veremos  en  el  siguiente  capítulo  que  la  teoría  de  Maxwell  es  explícitamente 
invariante  bajo  las  transformaciones  de  Lorentz  (aunque  no  sea  visible  en  esta  notación),  por 
lo  tanto  el  hecho  de  que  el  vector  de  Poynting  aparezca  en  estas  dos  formas  es  una  primera 
indicación  de  la  covariancia  de  la  teoría. 


1.4.  Potenciales  electromagnéticos  e invariancia  gauge 

Las  leyes  de  Maxwell  en  su  forma  diferencial  (1.21)-(1.24)  son  más  cómodas  de  resolver  que  en 
su  forma  integral  ( 1 .26)-(l  .29),  pero  aún  así  no  son  fáciles  por  la  aparición  del  operador  diferencial 
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V en  forma  de  divergencias  y rotacionales.  Resulta  que  las  dos  leyes  de  Maxwell  homogéneas,  la 
ley  de  Faraday  (1.22)  y la  de  la  divergencia  de  B (1.23),  nos  permiten  escribir  el  conjunto  en  una 
forma  más  accesible,  además  de  darnos  pistas  sobre  uno  de  las  aspectos  más  importantes  de  la 
física  moderna. 

El  hecho  de  que  la  divergencia  de  B siempre  es  cero,  implica,  por  las  propiedades  de  diver- 
gencias y rotacionales,  que  podemos  escribir  B como  el  rotacional  de  algún  campo  A:3 

B = VxA  (1.47) 

Sustituyendo  este  resultado  el  la  ley  de  Faraday  (1.22),  podemos  escribirla  como 

Vx(fi+  \dt^)  = °’  (1-48) 

intercambiando  las  derivadas  parciales  dt  y 0,  ■ Por  las  mismas  propiedades  de  rotacionales  y 
gradientes,  se  ve  que  la  combinación  E + c~1dtA  es  el  gradiente  de  un  campo  -é,  donde  el 
signo  menos  se  introduce  por  futura  conveniencia.  En  otras  palabras,  podemos  escribir  el  campo 
eléctrico  como 

É = -V(/>  - -dtÁ.  (1.49) 

c 

Los  campos  auxiliares  <¡>  y A son  los  llamados  potenciales  electromagnéticos,  que  nos  ayudarán  a 
escribir  la  teoría  de  Maxwell  en  una  forma  más  sencilla. 

Dado  <j>  y A,  los  campos  electromagnéticos  E y B están  completamente  determinados  a través 
de  las  expresiones  (1.47)  y (1.49).  Pero  lo  contrario  no  es  verdad:  dados  E y B,  ni  (j>,  ni  A están 
determinados  unívocamente.  Si  cambiamos  los  potenciales  <t>  y A por  otros  potenciales  <l>  y A', 
relacionados  con  los  originales  como 

<j>  ->  </)'  = $ + dt A,  Á—>Á'  = Á — cVA,  (1.50) 

con  A = A (x,t)  una  función  arbitraria,  entonces  los  campos  eléctricos  y magnéticos  E'  y B1 
generados  por  estos  potenciales  <j>'  y A'  toman  la  forma 

É'  = -V<¿>'  - ^dtA'  = -VjV  + díA)  - idt(A*-cVA)  = -$(/>- IdtÁ  = É, 

B’  = V x A'  = V x (Á-  cVA'j  = V x 1 - cV  x VA  = V x Á = B.  (1.51) 

En  otras  palabras,  los  potenciales  <f>'  y A'  dan  exactamente  los  mismos  campos  E y B que  ó y A. 
Es  más,  dado  que  A es  una  función  arbitraria,  hay  infinitos  potenciales  que  dan  todos  los  mismos 
campos  electromagnéticos  y por  lo  tanto  la  misma  física. 

¿Cómo  sabemos  ahora  con  qué  <f>y  A tenemos  que  trabajar?  ¿Cúal  de  estos  infinitos  potencia- 
les describe  correctamente  la  física  de  nuestro  sistema?  En  realidad,  la  respuesta  ya  viene  dada 
en  (1.51):  todos  los  potenciales  <j>  y A relacionados  a través  de  (1.50)  describen  la  misma  física,  ya 
que  todos  generan  los  mismos  campos  E y B.  En  un  experimento  se  puede  medir  la  intensidad  y 
la  dirección  del  campo  electromagnético  (es  decir  de  E y B),  pero  no  existe  ningún  experimento 
que  es  capaz  de  medir  directamente  (f>  y A y por  lo  tanto  capaz  de  distinguir  entre  unos  potencia- 
les u otros  relacionados  a través  de  (1.50).  En  realidad,  los  potenciales  <j>  y A son  solamente  unos 
campos  auxiliares,  que  hemos  introducido  por  mayor  facilidad  matemática,  pero  que  no  corres- 
ponden a ninguna  realidad  física.  La  realidad  física  esta  descrita  únicamente  por  los  campos  E y 
B,  ya  que  son  éstos  los  que  medimos  en  los  experimentos. 

3 Aquí  suponemos  que  el  espacio  es  simplemente  conexo,  lo  que  es  el  caso  para  R3.  Más  adelante  en  este  capítulo 
estudiaremos  soluciones  en  espacios  que  son  topológicamente  no-triviales. 
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Un  ejemplo  concreto  ilustrará  esta  idea  profunda:  ya  hemos  dicho  que  en  electrostática  el 
campo  eléctrico  de  una  carga  puntual  viene  dada  por  la  ley  de  Coulomb  (1.31), 

É = eT,  B = 0.  (1.52) 

47rrz 


Muchas  veces  se  presentan  los  potenciales  electromagnéticos  de  este  campo  eléctrico  en  el  llama- 
do gauge  de  Coulomb  , que  impone  sobre  el  potencial  vectorial  A la  condición  V ■ /I  = 0.  En  este 
caso  el  campo  eléctrico  esta  completamente  determinado  por  el  potencial  escalar  cf>,  ya  que  A se 
anula  en  todo  el  espacio: 


1=0. 


(1.53) 


Sin  embargo,  podemos  elegir  otros  potenciales  que  nos  generan  el  mismo  campo  electrostático 
(1.52).  En  particular  podemos  elegir  el  caso  donde  el  potencial  escalar  es  cero  en  todo  el  espacio 
y el  campo  eléctrico  está  soportado  exclusivamente  por  el  potencial  vectorial.  Efectivamente  los 
potenciales 


1 = 0, 


A' = - 


cqt 
4-7T  r2 


er , 


(1.54) 


generan  a través  de  (1.49)  exactamente  la  misma  expresión  (1.52)  para  el  campo  de  una  carga 
puntual  estática.  A primera  vista  podría  parecer  extraño  que  una  configuración  estática  como 
(1.52)  está  descrita  por  un  potencial  que  dependa  explíctamente  del  tiempo,  pero  esto  sólo  es 
un  prejuicio  inspirado  por  el  gauge  de  Coulomb,  puesto  que  los  potenciales  mismos  no  tienen 
significado  físico  y pueden  tener  una  dependencia  temporal  (lineal)  sin  que  lo  tenga  E.  La  de- 
pendencia temporal  de  A en  (1.54)  solamente  es  un  artefacto  de  la  elección  de  los  potenciales,  no 
un  efecto  físico.  Obsérvase  que  efectivamente  los  potenciales  (1.53)  y (1.54)  están  relacionados  a 
través  de  una  transformación  del  tipo  (1.50)  con  A = qt/4irr. 


Por  lo  tanto  vemos  que  la  teoría  de  Maxwell  tiene  una  cierta  redundancia  en  su  descripción: 
la  dinámica  está  descrita  por  más  variables  (ó  y A)  que  grados  de  libertad  físicos  (E  y B)  y 
tenemos  la  libertad  de  elegir  en  cada  momento  las  variables  que  más  nos  convengan.  Las  teorías 
de  este  tipo  se  llaman  teorías  gauge,  la  transformación  (1.50)  se  llama  una  transformación  gauge  y 
los  potenciales  f y A campos  gaugef 


El  hecho  de  que  una  transformación  gauge  deja  las  leyes  de  Maxwell  invariantes  (ya  que  apa- 
recen E y B,  pero  no  <l>  y A),  implica  que  la  teoría  de  Maxwell  tiene  una  simetría  inesperada:  dado 
que  los  potenciales  no  corresponden  a ninguna  realidad  física,  los  verdaderos  resultados  físicos, 
como  la  intensidad  del  campo  electromagnético,  su  energía  o su  el  momento,  no  pueden  depen- 
der de  la  elección  de  f y A.  Diferentes  elecciones  deberían  dar  el  mismo  resultado.  Esto  impone 
restricciones  muy  fuertes  sobre  la  forma  de  las  expresiones:  las  cantidades  físicamente  relevantes 
sólo  pueden  depender  de  las  combinaciones  de  los  potenciales  4>y  A que  son  invariantes  gauge. 
En  otras  palabras,  los  potenciales  sólo  pueden  aparecer  en  las  cantidades  físicas  en  las  combina- 
ciones E = Vo  - <r'dtA  y /i  = V x A.  Es  fácil  de  comprobar  que  las  expresiones  que  hemos 
derivado  en  la  sección  anterior  satisfacen  este  criterio. 


Es  difícil  sobreestimar  la  importancia  de  la  invariancia  gauge  en  la  física  moderna:  la  trans- 
formación (1.50)  en  la  teoría  de  Maxwell  sólo  es  el  caso  más  sencillo  de  invariancia  gauge:  en 
1954  los  físicos  (chino-)americanos  Chen  Ning  Yang  (1922  - ) y Robert  Mills  (1927  - 1999)  gene- 
ralizaron la  transformación  (1.50)  a grupos  no-Abelianos  y hoy  en  día  entendemos  la  interacción 
electrodébil  y la  interacción  fuerte  (e  incluso  hasta  cierto  punto  la  gravedad)  como  teorías  gauge, 
aunque  de  un  tipo  más  complicado  que  en  la  teoría  de  Maxwell. 

4To  gauge  en  inglés  significa  calibrar.  La  razón  porque  se  relaciona  las  transformaciones  (1.50)  con  las  calibraciones  es 
un  error  histórico  (pero  fructífero)  del  matemático  alemán  Hermann  Weyl  (1885  - 1955)  en  1918,  cuando  intentó,  sin  éxito, 
unificar  la  relatividad  general  y el  electromagnetismo  usando  invariancia  bajo  transformaciones  de  escala. 
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Habiendo  sacado  de  las  ecuaciones  homogéneas  las  expresiones  (1.47)  y (1.49)  para  É y B en 
función  de  <f>  y A,  nos  queda  sustituir  estas  expresiones  en  las  ecuaciones  inhomogéneas  restan- 
tes. Utilizando  las  propiedades  de  divergencias  y rotacionales,  no  es  difícil  de  ver  que  se  puede 
escribir  éstas  como 

-A d - -dt(V-H)  = p, 
c 

\d2tA  - AÁ  + V(idt^  + V • Á)  = -J,  (1.55) 

cr  c c 

para  la  ley  de  Gauss  (1.21)  y la  ley  de  Ampére-Maxwell  (1.24)  repectivamente.  Aquí  el  operador 
diferencial  A = X^-=i  es  el  laplaciano.  A primera  vista  estas  relaciones  no  parecen  mucho 
más  simples  que  las  ecuaciones  de  Maxwell  de  donde  las  hemos  derivado,  sobre  todo  debido  a 
los  últimos  términos  en  el  lado  izquierdo.  Si  no  fuera  por  este  término,  la  segunda  ecuación  de 
(1.55)  se  convertiría  en  una  ecuación  de  ondas  inhomogénea. 

Sin  embargo  la  invariancia  gauge  nos  proporciona  la  libertad  de  poder  cambiar  los  potencia- 
les ó y A según  (1.50),  de  modo  que  podemos  elegir  los  potenciales  de  forma  que  satsifagan  la 
condición 

V • A + -d t<t>  = 0,  (1.56) 

c 

tal  que  las  ecuaciones  (1.55)  se  reducen  a 

- A <!>  = p,  - AÁ=-J,  (1.57) 

o sea  la  ecuación  de  ondas  inhomogénea  en  tres  dimensiones. 

Aquí  hemos  visto  otro  ejemplo  más  de  cómo  la  ambigüedad  de  los  potenciales  electromag- 
néticos, más  que  ser  en  un  problema,  se  convierte  en  una  gran  ventaja:  una  buena  elección  de  <f> 
y A puede  simplificar  mucho  un  problema  dado.  Concretamente  la  condición  (1.56)  se  llama  el 
gauge  de  Lorenz.  Elegir  unos  potenciales  u otros  para  un  problema  concreto  se  llama  fijar  el  gauge 
y muchas  elecciones  de  gauge  son  típicas  para  ciertas  situaciones  físicas.  Por  ejemplo,  el  gauge 
de  Coulomb,  V • A = 0,  es  idóneo  para  problemas  de  electrostática,  pero  veremos  en  breve  que 
el  gauge  de  Lorenz  es  más  útil  en  relatividad  especial.  Otras  elecciones  de  gauge  comunes  son  el 
gauge  temporal  <¡>  = 0,  el  gauge  de  radiación  A — 0 (en  ausencia  de  cargas)  y el  gauge  axial  A ■ ñ = 0, 
donde  ñ es  un  vector  de  unidad  en  una  dirección  específica. 

Resumiendo  podemos  escribir  las  ecuaciones  de  Maxwell  como 

É = -Vd  - -dtÁ,  B = V x A,  (1.58) 

c 

- Ad  = p,  ^d2Á  -A  A =-J,  (1.59) 

siempre  y cuando  asumimos  que  4>  y A están  relacionados  a través  de  (1.56).  Las  ecuaciones 
(1.58)  nos  dicen  cómo  los  potenciales  interaccionan  con  las  cargas  y las  corrientes,  mientras  (1.59) 
nos  da  la  relación  entre  los  potenciales  y los  campos  físicos  E y B.  Se  puede  demostrar  que  la 
invariancia  gauge  está  íntimamente  ligado  con  la  teoría  matemática  de  formas  y que  las  ecuacio- 
nes homogéneas  (1.58)  son  en  realidad  una  identidad  de  Bianchi,  que  dice  que  el  tensor  electro- 
magnético es  (localmente)  exacto. 


1.5.  La  teoría  de  Maxwell  a través  del  principio  variacional 

De  la  mecánica  analítica  conocemos  las  ventajas  del  formalismo  lagrangiano  para  estudiar 
las  leyes  de  la  física:  un  lagrangiano  es  básicamente  la  integral  de  las  ecuaciones  de  movimiento 
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y permite  estudiar  con  más  facilidad  las  propiedades  y simetrías  de  la  teoría.  En  particular,  el 
principio  variacional  aplicado  a la  teoría  de  Maxwell  nos  enseña  unas  cuantas  cosas  que  no  son 
obvias  mirando  sólo  las  leyes  de  Maxwell  (1.21)-(1.24). 

La  acción  de  la  teoría  de  Maxwell  viene  dada  por 


•^Maxwell 


P<t>  + -J- A 
c 


(1.60) 


A primera  vista  esto  puede  parecer  una  acción  extraña,  ya  que  no  es  cuadrática  en  las  primeras 
derivadas  de  E y B,  como  uno  esperaría  de  la  mecánica  analítica.  Es  más,  variando  ingenuamente 
esta  acción  con  respecto  a los  campos  electromagnéticos  E y B , las  ecuaciones  de  movimiento 
de  darían  lugar  a la  condición  claramente  errónea  E = B = 0. 

La  razón  por  qué  la  acción  (1 .60)  sí  es  la  acción  correcta  es  que  en  realidad  las  variables  dinámi- 
cas de  la  teoría  de  Maxwell  no  son  los  campos  electromagnéticos  E y B,  sino  los  potenciales  ií>  y 
A.  A través  de  (1.47)  y (1.49)  podemos  reescribir  la  acción  (1.60)  como  (ejerc.) 


^Maxwell  — j d X 


Y,  dj(j)di^  + — ^ di4>dtAi  + dtAjdtAj 


12 


- \ Y,  djAjdjAj  + diAjdjAi  - p4>  + -¿¿A» 

ij  ij 


(1.61) 


que  sí  es  cuadrática  en  las  primeras  derivadas  de  los  potenciales.  Aún  así  el  lagrangiano  (1.61)  en 
términos  de  los  potenciales  sigue  teniendo  unas  propieades  que  no  estamos  acostumbrados  de 
ver  en  sistemas  de  variables  discretas.  Primero,  que  aparte  del  término  cinético  (<9A¿)2  para  A, 
tenemos  todo  tipo  de  términos  proporcionales  al  gradiente,  <9,  A,  . Además,  el  potencial  escalar  é 
sólo  tiene  términos  proporcionales  a su  gradiente  pero  no  tiene  un  término  cinético  (Oté)2 , 
lo  que  hace  que  en  realidad  (f>  no  sea  un  campo  dinámico. 

En  realidad  la  razón  por  qué  aparecen  un  tipo  de  términos  y no  el  otro  es  la  misma:  la  inva- 
riancia  gauge.  La  acción  debe  ser  invariante  bajo  las  transformaciones  (1.50),  ya  que  la  elección  de 
los  potenciales  no  puede  influenciar  la  física.  Sin  embargo,  al  escribir  un  término  cinético  (9tA,  )2, 
la  invariancia  gauge  nos  obliga  a incluir  también  los  términos  proporcionales  a ¿Aj  y nos  prohi- 
be  un  término  del  tipo  (dt<j>)2.  Dicho  de  otra  manera,  sólo  los  términos  que  aparecen  en  (1.61) 
combinan  a la  acción  manifestamente  invariante  gauge  E2  — B2  de  (1.60). 

La  idea  es  que  las  ecuaciones  de  movimiento  de  la  acción  (1.61)  nos  proporcionan  las  ecuacio- 
nes de  Maxwell.  Efectivamente,  las  ecuaciones  de  Euler-Lagrange  para  <!>  y A, 


d / SC  \ y,  d í SC  \ 5C 
dt\S(dt<j>))  + dxl  \5{di<j)))  6<¡> 

d / SC  \ d / SC  \ SC 

dt  \5{dtAj))  + ^ 9xl  \5(diAj))  ~ SAj 


(1.62) 


nos  proporcionan  precisamente  las  ecuaciones  (1.55)  (ejerc.),  que  sabemos  que  son  las  ecuaciones 
inhomogéneas  de  Maxwell  en  términos  de  los  potenciales.  En  otras  palabras,  la  ley  de  Gauss 
(1.21)  y la  ley  de  Ampére-Maxwell  (1.24)  son  las  ecuaciones  de  movimiento  de  respectivamente 
(j)  y A en  la  acción  (1.61). 

Por  otro  lado,  no  se  obtienen  las  ecuaciones  homogéneas  (1.22)  y (1.23)  de  esta  acción  a través 
de  un  principio  variacional.  La  gran  lección  que  nos  enseña  el  principio  variacional  en  la  teoría 
de  Maxwell  es  que  en  realidad  el  carácter  de  las  ecuaciones  homogéneas  es  completamente  dis- 
tinta a las  ecuaciones  inhomogéneas.  Como  hemos  explicado  en  la  sección  1.4,  las  ecuaciones 
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homogéneas  nos  informan  sobre  la  existencia  de  los  potenciales  <f>  y A:  recuérdese  que  (1.47)  y 
(1.49)  son  las  soluciones  generales  de  éstas.  En  otras  palabras,  más  que  unas  ecuaciones  dinámi- 
cas, las  ecuaciones  homogéneas  actúan  como  ligaduras  para  E y B,  permitiéndonos  escribirlos  en 
términos  los  potenciales  4>y  A.  Por  lo  tanto,  al  considerar  equivalentes  las  acciones  (1.60)  y (1.61) 
y al  reconocer  (¡>  y A como  las  verdaderas  variables  dinámicas  de  la  teoría,  ya  hemos  asumido 
implícitamente  las  ecuaciones  homogéneas  de  Maxwell  en  el  principio  variacional.  Lo  curioso  es 
que  esta  diferencia  entre  las  ecuaciones  homogéneas  e inhomogéneas  apenas  es  apreciable  a ni- 
vel de  las  ecuaciones  mismas,  mientras  que  está  clarisma  desde  el  punto  de  vista  del  formalismo 
lagrangiano. 

También  es  interesante  mirar  la  acción  de  una  partícula  con  masa  mo  y carga  eléctrica  q,  inter- 
accionando con  el  campo  electromagnético.  En  particular  esta  acción  viene  dada  por 


rl 


'-'partícula  = / dt[-mo'^2±l(t)xt(t)  - q<t>{x{t))  + ^^x\t)A\x{t)) 


(1.63) 


y es  fácil  de  ver  (ejerc.)  que  la  ecuación  de  Euler-Lagrange 


da  lugar  a 


d / SC  \ 
dt  V Sxi ) 


mox 


di<¡>  + bdtAi 


1 

c 


II 

o 

(1.64) 

\diAj  - djAÁ  = 0. 

(1.65) 

j 


Dándonos  cuenta  de  que  las  expresiones  entre  corchetes  son  precisamente  las  combinaciones 
(1.49)  y (1.47)  (no  debería  sorprendernos,  ¡si  no  la  ecuación  no  sería  invariante  gauge!),  podemos 
interpretar  esta  ecuación  como  la  segunda  ley  de  Newton  para  una  partícula  sometida  a la  fuerza 
de  Lorentz  (1.33), 


?7Tq  X 


E 


v x B 


(1.66) 


Nótese  que  debido  al  acoplo  de  x y A en  la  acción  (1.63),  el  momento  canónico  conjugado  de 

xl  no  es  pl  = rriox1,  sino 


y por  lo  tanto  el  hamiltoniano  viene  dado  por 
Hr .articula  Í dt  I"  — " 


q-A\ 

c 

(1.67) 

~cA(x))  + #(a0  • 

(1.68) 

Este  hamiltoniano,  con  acoplo  mínimo  al  campo  electromagnético,  se  utiliza  mucho  en  la  mecánica 
cuántica.  Al  discutir  el  efecto  Aharonov-Bohm  en  la  sección  1.6  veremos  una  aplicación  de  esta 
expresión. 


Finalmente,  aunque  hemos  discutido  la  invariancia  gauge  de  los  términos  cinéticos  de  (1.61), 
no  hemos  dicho  nada  sobre  la  invariancia  de  los  términos  de  acoplo,  ni  (1.61),  ni  en  (1.63).  Puede 
parecer  extraño  que  los  últimos  dos  términos  de  (1.63)  contienen  (j)  y A tal  cuales,  ya  que  parecen 
romper  la  invariancia  gauge.  Sin  embargo,  una  transformación  gauge  (1.50)  induce  la  siguiente 
transformación  en  la  acción 


Cr 


partícula  r ^partícula  — ^-partícula  Q 


= Cr 


dtA  — - ^2  x1  c di  A 


•^partícula  9^A(tja:) 


partícula  t 


(1.69) 
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donde  en  la  segunda  igualdad  hemos  usado  la  regla  de  la  cadena  y en  la  tercera  el  hecho  de  que 
dos  lagrangianos  que  difieren  por  una  derivada  total  son  físicamente  equivalentes.  Por  lo  tanto,  a 
pesar  de  que  los  potenciales  aparecen  desnudos,  una  transformación  gauge  no  tiene  efecto  físico 
en  (1.63),  ya  que  sólo  dan  lugar  a una  derivada  total. 

Una  cosa  parecida,  aunque  no  igual,  ocurre  con  los  términos  de  acoplo  de  (1.60):  una  trans- 
formación gauge  (1.50)  cambiaría  la  acción  como 


♦^Maxwell  * ^Maxwell  — ^Maxwell  I d X p dt  A H-  ^ ^ ji  djK. 


— ^Maxwell  H-  J d X 
^Maxwell  •> 


dtp  + 


A 


(1.70) 


donde  en  la  segunda  igualdad  hemos  integrado  por  partes  y en  la  tercera  hemos  quitado  la  se- 
gunda integral,  gracias  a la  ley  de  conservación  de  carga  (1.35).  En  otras  palabras,  la  acción  (1.60) 
es  invariante  gauge  gracias  a la  conservación  de  carga.  Pero  lo  contrario  también  es  verdad:  por  el 
teorema  de  Noether  sabemos  que  a cada  simetría  continua  corresponde  una  cantidad  conservada 
(y  vice  versa),  y lo  que  estamos  viendo  aquí  es  que  la  carga  eléctrica  es  la  cantidad  conservada 
asociada  a la  simetría  de  la  acción  (1.60)  bajo  transformaciones  gauge  (1.50). 


1.6.  Soluciones  de  las  ecuaciones  de  Maxwell 

Con  las  ecuaciones  (1.57)  para  los  potenciales  no  resulta  difícil  encontrar  soluciones  de  las 
ecuaciones  de  Maxwell.  Una  gran  ventaja  de  la  estructura  de  las  ecuaciones  es  que  son  lineales, 
así  que  cualquier  combinación  lineal  de  dos  soluciones  también  es  una  solución. 

En  la  sección  1.2  ya  hemos  mencionado  algunas  soluciones,  como  la  de  la  carga  puntual,  el 
conductor  lineal  y el  solenoide  infinito.  En  esta  sección  repasaremos  alguna  soluciones  más,  que 
son  interesantes  por  su  relevancia  física. 

Ondas  electromagnéticas 

Una  de  las  propiedades  sorprendentes  de  las  ecuaciones  de  Maxwell  es  que  existen  soluciones 
no-triviales  en  ausencia  de  cargas  y corrientes.  Las  llamadas  ecuaciones  del  vacío  son 

V-  É = 0,  V-  B = 0,  (1.71) 

VxÉ  = --dtB,  VxB  = -dtÉ.  (1.72) 

c c 

Una  primera  observación  es  la  remarcable  simetría  entre  campos  eléctricos  y magnéticos  en  la 
ausencia  de  cargas.  En  la  presencia  de  cargas  esta  simetría  está  rota  debido  al  hecho  de  que 
existen  cargas  eléctricas,  pero  no  hay  monopolos  magnéticos.  Volveremos  a este  tema  un  poco 
más  adelante. 

Una  segunda  observación  es  que  la  estructura  de  las  ecuaciones  del  vacío  permite  la  existen- 
cia de  paquetes  de  campo  viajando  por  el  espacio:  en  la  ecuación  (1.72)  vemos  que  un  cambio 
en  el  campo  magnético  induce  un  campo  eléctrico  por  la  ley  de  Faraday,  y a su  vez  un  cambio 
de  campo  eléctrico  induce  por  el  término  de  Maxwell  un  campo  magnético.  Un  cambio  en  el 
campo  electromagnético  genera  por  lo  tanto  más  cambios,  resultando  en  paquetes  de  campo  pro- 
pagándose por  el  espacio  independientemente  de  cargas  y corrientes.  Estos  paquetes  de  campo 
se  llaman  ondas  electromagnéticas.  Estudiamos  ahora  estas  soluciones  un  poco  más  en  detalle. 
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El  caso  más  sencillo  es  cuando  los  campos  É y B sólo  dependen  de  una  coordenada,  digamos 
x,  y del  tiempo.  Entonces  las  ecuaciones  (1.71)-(1.72)  se  reducen  a 


dxEx 

= dxBx  = dtEx 

= dtBx  = 0, 

(1.73) 

dxEz 

dxBy  = ~^dtEz, 

(1.74) 

dxEy 

= - -dtBz , 

dxBz  = -~dtEy. 

(1.75) 

La  solución  de  (1.73)  es  Ex  = C-L  y Bx  = C2,  con  C\  y C2  constantes  que  tomaremos  cero,  puesto 
que  no  estamos  interesados  de  momento  en  campos  constantes.  Las  dos  ecuaciones  de  (1.74) 
forman,  igual  que  las  dos  de  (1.75),  un  conjunto  de  ecuaciones  que  se  desacopla  de  las  otras. 
Sustituyendo  la  segunda  ecuación  en  en  la  primera  y vice  versa,  vemos  que  podemos  escribir 
(1.74)  como 


y (1.75)  como 


±d¿Ez  - dlEz  = 0, 
¿ dtEy  - dlEy  = 0, 


C2  dt  By  dxBy  — 0, 

¿r$Bz  - dxBz  = 0, 


(1.76) 

(1.77) 


Vemos  por  lo  tanto  que  cada  componente  satisface  una  ecuación  de  ondas  unidimensional,  que 
tiene  como  solución  más  general 


Ey  = fi(x  + ct)  + gi(x  - ct),  Ez  = f2{x  + ct)  + g2(x  - ct),  (1.78) 

Bz  = c_1  fi(x  + ct)  — c~1gi(x  — ct),  By  = —c~1f2( x + ct)  + c~1g2(x  - ct), 

donde  f\,f2,g\  y g2  son  funciones  arbitrarias  de  su  argumento.  Las  funciones  f(x  + ct)  repre- 
sentan una  onda  que  se  propaga  con  velocidad  c,  la  velocidad  de  la  luz,  en  la  dirección  del  eje 
x negativo,  mientras  las  funciones  g(x  — ct)  una  onda  en  la  dirección  del  eje  x positivo.  Dado 
que  el  campo  no  depende  de  las  direcciones  y ó z,  el  campo  electromagnético  toma  los  mismos 
valores  en  los  planos  x = constante.  Las  soluciones  que  tienen  este  propiedad  se  llaman  ondas 
planas.  Nótese  que  la  amplitud  de  la  onda  es  perpendicular  a la  dirección  de  propagación.  Las 
ondas  electromagnéticas  son  por  lo  tanto  ondas  transversales. 

Una  clase  importante  de  ondas  planas  son  las  llamadas  ondas  monocromáticas,  donde  las  fun- 
ciones / y g son  senos  y cosenos.  La  solución  (1.78)  es  entonces  de  la  forma 

Ei  = Ai  cos(kx  ± ut  + (fi),  Bi  = c~1Aicos(kx  ± ixt  + ifi),  (1.79) 


donde  A¿  es  la  amplitud,  k el  número  de  onda,  u>  la  frecuencia  angular  y ipt  la  fase.  Para  que 
las  ondas  monocromáticas  sean  de  la  forma  (1.78),  el  número  de  onda  y la  frecuencia  tienen  que 
satisfacer  la  relación  de  dispersión  en  el  vacío 

u>  = ck.  (1.80) 


Desde  el  punto  de  vista  físico,  las  ondas  monocromáticas  no  corresponden  a una  realidad  física, 
puesto  que  se  extienden  por  el  espacio  entero  y tendrían  una  energía  infinita.  Sin  embargo  desde 
el  punto  de  vista  matemático  es  un  concepto  muy  útil,  ya  que  son  fáciles  de  manejar.  Además 
sabemos  por  el  análisis  de  Fourier  que  cualquier  solución  (1.78)  se  puede  escribir  como  una  su- 
perposición de  ondas  monocromáticas  de  distintas  frecuencias. 

La  longitud  de  onda  A viene  dada  por  el  número  de  onda  y la  frecuencia  v está  relacionada 
con  la  frecuencia  angular  u>  mediante 


(1.81) 


Nótese  que  la  conocida  fórmula  para  la  velocidad  de  propagación  de  ondas  nos  da  efectivamente 
la  velocidad  de  la  luz: 


(1.82) 
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Figura  1.6:  Los  potenciales  retardados:  los  potenciales  electromagnéticos  en  el  punto  r en  t = to  vienen 
dado  por  la  suma  de  todas  las  contribuciones  de  cargas  y corrientes  en  los  puntos  r ' en  el  momento 
t — | r — r'\/c. 


Al  darse  cuenta  que  existen  soluciones  de  paquetes  de  campo  electomagnético  que  se  pro- 
pagan con  la  velocidad  de  la  luz,  Maxwell  identificó  la  luz  como  ondas  electromagnéticas.  La 
conexión  entre  el  electromagnetismo  y la  óptica  fue  uno  de  los  grandes  éxitos  de  la  teoría  de 
Maxwell.  No  sólo  era  la  primera  vez  que  alguien  venía  con  una  teoría  fundamental  para  expli- 
car la  naturaleza  de  la  luz,  sino  esa  teoría  también  daba  una  base  sólida  a la  óptica  y permitía 
derivar  las  leyes  empíricas  de  la  óptica  y calcular  índices  de  relexión  y refracción  de  materiales. 
Pero  aparte  la  teoría  de  Maxwell  es  capaz  de  dar  una  explicación  de  cómo  surgen  estas  ondas 
electromagnéticas.  Esto  lo  veremos  en  el  siguiente  apartado. 

Potenciales  retardados 

Resolvemos  ahora  las  ecuaciones  generales  de  Maxwell.  Ya  hemos  visto  que,  elegiendo  el 
gauge  de  Lorenz,  se  puede  escribir  las  ecuaciones  de  Maxwell  en  función  de  los  potenciales  elec- 
tromagnéticos como 


- A <¡>  = p,  - AA  = -J.  (1.83) 

Por  la  teoría  de  ecuaciones  diferenciales  sabemos  que  la  solución  general  de  una  ecuación  lineal 
inhomogénea  consiste  de  la  suma  de  las  soluciones  de  la  ecuación  homogénea  y una  solución 
particular.  En  el  caso  de  las  ecuaciones  de  Maxwell,  las  soluciones  de  las  ecuaciones  homogéneas 
son  las  ondas  electromagnéticas  que  hemos  visto  en  la  subsección  anterior. 

La  derivación  de  la  solución  particular  en  principio  no  es  muy  diferente  al  caso  de  la  elec- 
troestática  o las  corrientes  constantes.  Para  calcular  el  valor  de  los  potenciales  en  un  punto  r en 
el  momento  t,  tenemos  que  sumar  (integrar)  todas  las  contribuciones  de  cargas  y corrientes  en 
todos  los  elementos  de  volumen  d3x.  La  diferencia  con  el  caso  estático  es  que  para  obtener  la 
contribución  de  un  elemento  de  volumen  en  posición  r ' no  hay  que  tomar  la  densidad  de  carga 
y corriente  en  el  momento  t,  sino  en  el  momento  t — | r — r'\/c,  dado  que  el  tiempo  \r  — f '\/c  es  el 
que  necesita  una  onda  electromagnética  (y  por  lo  tanto  también  la  contribución  a los  potenciales) 
para  viajar  de  r'  a r (véase  Figura  1.6).  Los  potenciales  que  reflejan  esta  propiedad  se  llaman  los 
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Figura  1.7:  Ondas  electromagnéticas  debidas  a cargas  aceleradas:  una  carga  originalmente  en  reposo  en 
el  punto  O acelera  y se  mueve  al  punto  P.  Lejos  de  la  carga,  las  líneas  de  campo  todavía  están  como  si 
la  carga  estuviera  en  O,  mientras  cerca  de  la  carga  las  líneas  ya  se  han  adaptado.  Entremedias  hay  una 
discontinuidad  que  se  expande  con  la  velocidad  de  la  luz. 


potenciales  retardados  y tienen  la  forma 


t ) 

Á{r,  t) 


1 

47 r 

1 

47TC 


7(r-y-^P) 

\r  — r'\ 


dr 


dr ' . 


r — r ' 


(1.84) 

(1.85) 


Nótese  que  en  el  caso  estático  recuperemos  el  potencial  de  Coulomb  y el  potencial  de  Biot-Savart. 

Con  la  expresión  de  los  potenciales  retardados  vemos  lo  que  ya  habíamos  mencionado  en 
la  introducción  de  este  capítulo:  los  campos  electromagnéticos  (o  aquí  los  potenciales)  juegan  el 
papel  de  intermediarios  que  transmiten  la  interacción  entre  partículas.  Aunque  el  viejo  modelo 
newtoniano  de  interacciones  a distancia  ya  parecía  poco  físico  y causaban  muchas  críticas  desde 
los  primeros  momentos5,  estos  inconvenientes  fueron  olvidados  rápidamente  al  ver  el  éxito  de  la 
ley  de  la  gravedad  a la  hora  de  resolver  problemas  concretos.  En  el  contexto  de  teoría  de  campos, 
una  partícula  no  interacciona  directamente  con  otra,  sino  con  los  campos  presentes,  que  hacen 
propagar  la  influencia  de  la  partícula  con  una  velocidad  finita  (la  velocidad  de  la  luz)  hasta  llegar 
a otras  partículas. 

En  este  sentido  las  ondas  electromagnéticas  en  la  teoría  de  Maxwell  son  precisamente  esto: 
distorsiones  del  campo  electromagnético  debido  a la  acceleración  de  cargas  y que  se  propagan 
con  la  velocidad  de  la  luz.  Consideremos  una  carga  inicialmente  en  reposo. En  el  momento  t = to 
la  carga  acelera  hasta  una  velocidad  v durante  un  intervalo  Ai.  La  configuración  de  las  lineas  de 
campo  en  un  momento  t > to  + Ai  consiste  de  dos  partes  (véase  Figura  1.7):  a distancias  r > cí 
las  lineas  de  campo  todavía  están  como  estaban  antes  de  que  la  carga  se  moviese,  dado  que  la 
señal  no  ha  tenido  tiempo  para  llegar  hasta  allí.  La  contribución  a los  potenciales  retardados  en 
los  puntos  con  r > ct  es  como  si  la  carga  todavía  estuviera  en  el  sitio  original.  A distancias  r < cí 
sin  embargo  las  lineas  de  campo  apuntan  directamente  a la  carga  por  la  ley  de  Coulomb.  Entre 
las  dos  zonas  hay  una  discontinuidad  esférica  de  grosor  cAí  que,  debido  a la  estructura  de  las 

5Newton  nunca  pretendía  tener  una  explicación  física  para  la  gravedad,  sólo  quería  dar  la  expresión  correcta  de  la 
fuerza.  De  allí  su  respuesta:  "Hipotheses  non  fingo"  (No  invento  hipótesis). 
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ecuaciones  del  vacío,  se  expande  con  la  velocidad  de  la  luz,  formando  una  onda  electromagnética 
esférica. 

La  propiedad  de  que  la  información  se  propague  con  velocidad  menor  o igual  a la  de  la  luz  es 
típica  de  teorías  relativistas,  dado  que  la  velocidad  de  la  luz  como  velocidad  máxima  es  justo  uno 
de  los  postulados  de  la  teoría  de  la  relatividad  especial,  como  veremos  en  los  siguientes  capítulos. 
El  hecho  de  que  esto  aparece  de  manera  natural  en  la  teoría  de  Maxwell  es  otra  manifestación  de 
que  esta  teoría  ya  es  relativista. 
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Capítulo  2 

El  Principio  de  la  Relatividad 


¿Cómo  puede  ser  que  las  matemáticas,  después  de  todo  un  producto  del  pensamiento  humano 
independiente  de  la  experiencia,  son  tan  admirablemente  adecuadas  para  describir  los  objetos 
de  la  realidad? 

(A.  Einstein) 


2.1.  El  Principio  de  la  Relatividad 

Puede  resultar  sorprendente,  pero  históricamente  el  Principio  de  la  Relatividad  es  mucho  más 
antiguo  que  la  Teoría  de  la  Relatividad,  incluso  más  antiguo  que  la  mecánica  clásica  de  Newton. 
Fue  formulado  por  Galileo  Galilei  (1564  - 1642)  alrededor  de  1600,  como  un  argumento  en  la 
discusión  del  heliocentrismo  versus  el  geocentrismo.  Los  defensores  del  geocentrismo,  que  en 
este  momento  creían  firmemente  en  la  física  de  Aristóteles  (384  A.C.  - 322  A.C.)  y en  la  astronomía 
de  Ptolomeo  (c.  100  - c.  170),  argumentaban  que,  si  era  verdad  que  la  Tierra  se  moviera  alrededor 
del  Sol  y alrededor  de  su  eje,  ¿porqué  no  lo  notamos?  ¿Porqué  una  bola  que  dejamos  caer  desde 
una  torre  alta  termina  al  pie  de  la  torre  y no  a cierta  distancia  hacia  el  Oeste?,  debido  a la  supuesta 
rotación  de  la  Tierra  de  Oeste  a Este. 

Como  respuesta  a este  argumento  Galilei  introdujo  una  nueva  idea:  la  inercia.  De  sus  múlti- 
ples experimentos  con  pelotas  rodando  sobre  planos  inclinados,  había  llegado  a la  conclusión 
de  que  una  masa  en  movimiento  uniforme  rectilíneo  mantendrá  eternamente  este  movimiento 
mientras  que  no  actúe  ninguna  fuerza  exterior  sobre  ella.  (Nótese  que  esto  no  es  nada  menos 
que  la  Segunda  Ley  de  Newton,  F = ma,  en  forma  cualitativa.)  Como  ejemplo,  Galilei  dijo  que  si 
dejamos  caer  una  pelota  desde  la  gavia  de  un  barco  en  movimiento  (uniforme),  la  pelota  tocará  la 
cubierta  en  el  pie  del  mástil  y no  más  hacia  la  popa,  puesto  que  la  pelota  conserva  la  velocidad 
uniforme  del  barco  durante  su  caida.  De  la  misma  manera,  el  argumento  de  los  geocentristas  no 
demostraba  necesariamente  que  la  Tierra  está  en  reposo.1 

El  propio  Galilei  se  daba  cuenta  que  la  formulación  inversa  también  es  válida.  Imaginémosnos 
un  observador  que  se  mueve  con  la  misma  velocidad  que  una  masa  en  movimiento  uniforme  y 
rectilíneo.  Para  este  observador  la  masa  estará  en  reposo.  Dado  que,  por  el  principio  de  inercia,  sin 
influencias  externas  ambos  mantendrán  su  movimiento,  para  el  observador  esta  masa  seguirá  en 
reposo  hasta  que  actúe  una  fuerza  exterior  sobre  ella. 

1 En  realidad,  si  la  bola  cae  desde  una  altura  suficientemente  alta,  se  espera  el  efecto  contrario:  antes  de  caer,  el  sistema 
Tierra-torre-bola  gira  como  un  cuerpo  rígido,  de  modo  que  la  velocidad  inicial  de  la  bola  es  mayor  cuanto  más  alta  la 
torre.  Durante  la  caida,  la  bola  conservará  esa  velocidad  y acabará  por  lo  tanto  una  distancia  (en  la  práctica  despreciable) 
más  hacia  el  Este. 
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Por  lo  tanto  la  conclusión  que  sacaba  Galilei  es  que  un  observador  no  es  capaz  de  determinar 
si  él  está  en  un  sistema  que  está  en  reposo  o en  movimiento  uniforme  y rectilíneo.  El  observador 
puede  lanzar  o dejar  caer  masas,  dejar  rodar  pelotas  sobre  planos  inclinados,  medir  el  periodo 
de  péndulos,  los  resultados  serán  los  mismos  en  movimiento  (uniforme)  que  en  reposo.  Más 
general,  una  persona  encerrada  en  una  caja,  con  todos  los  experimentos  mecánicos  imaginables 
a su  disposición,  no  tiene  manera  alguna  de  determinar  su  estado  de  movimiento,  sin  mirar  por 
una  ventanilla.  Este  principio  se  llama  el  Principio  de  la  Relatividad. 


Principio  de  la  Relatividad  (formulación  de  Galilei):  Es  imposible  determinar  a base  de 
experimentos  (mecánicos)  si  un  sistema  de  referencia  está  en  reposo  o en  movimiento  uniforme 
y rectilíneo. 


Aunque  en  la  vida  cotidiana  estamos  muy  acostumbrados  a notar  si  nos  movemos  o no  (¿por 
qué?),  hay  numerosos  ejemplos  en  los  que  se  aplica  claramente  el  Principio  de  la  Relatividad. 
Mirando  por  la  ventana  de  un  tren  en  la  estación,  no  sabemos  si  empieza  a moverse  nuestro  tren 
o él  de  al  lado.  En  un  atasco  delante  de  un  semáforo  pensamos  que  estamos  rodando  hacia  atrás, 
si  el  coche  de  delante  sale.  Dos  balsas  en  medio  del  océano,  que  se  alejan  una  de  otra,  no  pueden 
determinar  si  la  primera  se  aleja  de  la  segunda,  o vice  versa. 

El  Principio  de  la  Relatividad,  por  muy  trivial  que  pueda  parecer,  es  un  principio  profundísi- 
mo y tiene,  como  veremos  en  este  curso,  consecuencias  muy  lejanas,  determinando  la  forma  de 
las  leyes  de  la  física  y la  estructura  del  espacio  y del  tiempo.  El  Principio  de  la  Relatividad,  aun- 
que formulado  ya  alrededor  del  año  1600,  es  la  base  directa  de  la  teoría  de  la  relatividad  especial 
(1905)  y su  generalización,  el  Principio  de  la  Equivalencia  (Capítulo  8),  la  de  la  teoría  de  la  relati- 
vidad general  (1916). 

Para  entender  bien  su  importancia,  formularemos  el  Principio  de  otra  manera.  Definimos  co- 
mo sistemas  inerciales  un  conjunto  de  sistemas  de  referencia  que  están  en  reposo  o en  movimiento 
uniforme  y rectilíneo  con  respecto  a un  sistema  previamente  elegido  como  inercial.2  Ahora,  el 
Principio  de  la  Relatividad  es  solamente  válido  dentro  de  la  misma  clase  de  sistemas  inerciales 
(ya  que  salir  de  la  clase  de  sistemas  inerciales  implica  aceleraciones,  que  son  medibles  a través 
de  experimentos).  Sin  embargo,  dentro  de  una  clase  de  sistemas  inerciales,  no  hay  observadores 
privilegiados:  dentro  de  la  misma  clase  de  sistemas  inerciales  no  se  puede  determinar  qué  siste- 
ma está  en  "reposo  absoluto"  y cuál  en  "movimiento  absoluto".  Todos  los  experimentos  dan  el 
mismo  resultado  para  cualquier  observador  y por  lo  tanto  todos  los  observadores  inerciales  ven 
la  misma  física.  Ninguno  de  ellos  tiene  un  punto  de  vista  priveligiado  frente  a los  otros. 


Principio  de  la  Relatividad  (formulación  de  equivalencia):  Todos  los  sistemas  inerciales 
son  equivalentes,  es  decir,  todos  los  observadores  inerciales  ven  la  misma  física. 


Nadie  se  había  dado  cuenta  realmente  de  la  importancia  de  esta  formulación  hasta  el  prin- 
cipio del  siglo  XX,  cuando  Henri  Poincaré  (1854-1912)  lo  tomó  como  principio  básico  y suge- 
rió  que  hacía  falta  una  nueva  formulación  de  la  mecánica,  basada  en  este  principio.  Aunque 
Poincaré  nunca  llegó  a dudar  de  la  existencia  del  éter,  sí  se  hacía  serias  preguntas  sobre  el  sig- 
nificado de  simultaniedad  de  eventos  y derivaba  la  regla  relativista  de  la  suma  de  velocidades. 
Sin  embargo,  no  llegó  a formular  una  mecánica  relativista  completa.  Este  logro  está  a nombre 
de  Albert  Einstein  (1879-1955).  El  razonamiento  de  Einstein  era  que,  si  todos  los  sistemas  iner- 
ciales son  equivalentes  y todos  los  observadores  inerciales  ven  la  misma  física,  entonces  todos 
estos  observadores  inerciales  deben  llegar  a las  mismas  leyes  de  la  física,  si  quieren  apuntar  los 
resultados  de  sus  experimentos.  En  otras  palabras: 

2 Nótese  que  esta  definición  es  altamente  circular  y no  precisa  cuales  son  los  observadores  inerciales.  Sólo  dice  que 
si  conocemos  uno,  podemos  encontrar  todos  de  su  clase.  Veremos  en  la  sección  8.6  por  qué  es  tan  difícil  identificar 
observadores  como  inerciales,  pero  ya  podemos  adelantar  que  el  problema  toca  la  esencia  de  la  teoria  de  la  relatividad 
general. 
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Principio  de  la  Relatividad  (formulación  de  Einstein):  Las  leyes  de  la  física  deben  tener 
la  misma  forma  en  todos  los  sistemas  inerciales. 


El  gran  logro  de  Poincaré  y Einstein  fue  darse  cuenta  que  el  Principio  de  la  Relatividad  no 
sólo  se  aplica  a la  mecánica,  sino  a la  física  entera,  incluidos  el  electromagnetismo  y la  óptica. 
Esta  extensión  es  importante,  puesto  que  como  veremos  en  la  sección  2.3,  hay  un  conflico  directo 
entre  la  mecánica  newtoniana  y el  electromagnetismo  de  Maxwell  (1831-1879)  si  aplicamos  el 
Principio  de  la  Relatividad. 

Formulado  de  esta  manera,  el  Principio  de  la  Relatividad  impone  ciertas  condiciones  sobre 
la  forma  de  las  leyes  de  la  física.  Existen  unas  transformaciones,  llamadas  cambios  de  coordenadas, 
que  relacionan  la  posición,  velocidad,  etc.  de  un  observador  con  otro.  Para  no  salir  de  la  clase  de 
sistemas  inerciales,  estos  cambios  de  coordenadas  tienen  una  forma  específica  y estas  transfor- 
maciones tienen  la  estructura  matemática  de  un  grupo.  La  formulación  de  Einstein  del  Principio 
de  la  Relatividad  implica  por  lo  tanto,  que  las  leyes  de  la  física  tienen  que  ser  de  tal  forma  que,  al 
hacer  un  cambio  de  coordenadas  entre  dos  sistemas  inerciales,  tienen  que  tener  la  misma  forma. 
En  otras  palabras:  las  leyes  de  la  física  deben  ser  invariantes  y las  cantidades  físicas  que  aparecen 
en  estas  leyes  tienen  que  ser  tales  que  transforman  bien  bajo  las  transformaciones  de  ese  grupo. 


Principio  de  la  Relatividad  (formulación  covariante):  Las  leyes  de  la  física  transforman 
bien  bajo  las  transformaciones  del  grupo  de  simetría  que  relacionan  los  distintos  observado- 
res. 


Investigemos  ahora  en  detalle  cuáles  son  estas  transformaciones  de  simetría  y cómo  las  leyes 
conocidas  transforman  bajo  ellas. 


2.2.  Simetrías  y la  forma  de  las  leyes  de  la  física 


Las  leyes  de  la  física  son  invariantes  bajo  traslaciones  en  el  tiempo 

t ->  t + At,  (2.1) 

para  cualquier  valor  de  At.  En  otras  palabras,  no  hay  un  momento  especial  t = 0 y las  leyes  son 
válidas  en  todos  los  momentos  t.  Esta  simetría  encaja  bien  con  la  hipótesis  básica  de  la  ciencia 
de  que  los  resultados  son  reproducibles, ' por  la  sencilla  razón  de  que  si  no  la  teoría  no  sería 
refutable.  Si  un  científico  obtiene  cierto  resultado  en  el  momento  t = f i,  otro  investigador  debería 
ser  capaz  de  obtener  el  mismo  resultado  a í = ti  + Ai.  La  simetría  (2.1)  se  llama  la  homogeneidad 
del  tiempo. 

De  la  misma  manera,  las  leyes  de  la  física  son  invariantes  bajo  traslaciones  en  el  espacio 

f->r  + f0,  (2.2) 

para  cualquier  vector  fo ■ Físicamente  esto  corresponde  al  hecho  de  que  no  importa  el  lugar  donde 
hacemos  los  experimentos  y matemáticamente  a que  no  hay  un  punto  especial  en  el  espacio  y 
que  podemos  elegir  el  origen  del  sistema  de  referencia  donde  queramos.  Esta  simetría  se  llama 
la  homogeneidad  del  espacio. 

La  isotropía  del  espacio  es  el  hecho  de  que  todas  las  direcciones  son  equivalentes  y que  no 
hay  ninguna  dirección  preferida.  En  otras  palabras,  la  orientación  de  un  experimento  físico  es 

3Aunque  existe  un  Armáis  oí  Improbable  Research,  editado  por  la  misma  gente  que  cada  año  entrega  the  Ignoble 
Prizes,  un  premio  por  investigaciones  "that  cannot  or  should  not  be  reproduced. ". 
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(2.3) 


irrelevante.  La  isotropía  implica  una  invariancia  bajo  rotaciones  ortogonales  arbitrarias 

3 

XH  =Y^,Mijx\ 

3=  1 

donde  Ml3  es  la  matriz  ortogonal  que  representa  la  rotación  SO( 3). 

Como  ya  mencionamos  antes,  estas  simetrías  imponen  restricciones  en  la  forma  que  pueden 
tener  las  leyes  físicas.  La  homogeneidad  del  tiempo  causa  que  un  lagrangiano4  C = T — V,  que 
describe  un  sistema  de  objetos  en  posiciones  con  velocidades  <j¿,  no  puede  depender  explícita- 
mente de  t : 

dt£(qi(t),qi(t))  = 0.  (2.4) 

Como  indicado,  las  variables  q¿  y q¡  sí  pueden  ser  dinámicas  y depender  de  t,  pero  la  depen- 
dencia del  lagrangiano  de  t sólo  puede  darse  a través  de  éstas  variables.  La  homogeneidad  del 
espacio  implica  que  las  interacciones  permitidas  en  el  potencial  V{qi)  sólo  pueden  depender  de 
las  distancias  entre  dos  partículas,  pero  no  de  las  posiciones  de  las  partículas  con  respecto  a cierto 
origen.  Y finalmente  la  isotropía  del  espacio  implica  que  el  potencial  V tiene  que  ser  un  potencial 
central,  que  depende  de  la  distancia  radial  r,  pero  no  de  los  ángulos. 

Efectivamente,  los  potenciales  que  uno  encuentra  en  teorías  de  gravedad,  electromagnetismo, 
física  molecular  o nuclear  son  típicamente  de  la  forma  V = V(\r-\  — ryl),  que  claramente  satisface 
los  requisitos  mencionados  arriba. 

Las  simetrías  no  sólo  restringen  la  forma  que  puede  tener  una  teoría,  sino  también  ayudan 
a la  hora  de  encontrar  soluciones  de  las  ecuaciones  de  movimiento.  Si,  por  ejemplo,  queremos 
encontrar  la  expresión  para  el  campo  eléctrico,  causado  por  un  electrón  en  reposo  en  el  origen  de 
un  sistema  de  coordenadas,  tenemos  que  resolver  la  ecuación  de  Laplace  para  el  potencial  <j>, 

V2</>  = \dr(r2dr<j>)  + 1 <9fl(sin ed0(/>)  + 1 2 d%<t>  = 0.  (2.5) 

r2  r2  sin  0 r2  sin  9 

Para  resolver  la  ecuación  (2.5),  se  podría  aplicar  el  método  de  separación  de  variables  y buscar  la 
solución  más  general  en  función  de  las  funciones  armónicas  esféricas  Yim(9 , y),  pero  nos  ahorra- 
remos mucho  trabajo  si  utilizamos  la  simetría  del  sistema.  Dado  que  el  electrón  en  el  origen 
posee  una  simetría  esférica,  el  campo  eléctrico  también  tiene  que  reflejar  esta  simetría:  la  solución 
dependerá  sólo  de  la  coordenada  radial  r y no  de  los  ángulos  9 y y.  La  ecuación  diferencial  parcial 
(2.5)  se  reduce  por  lo  tanto  a una  ecuación  diferencial  ordinaria  en  r y es  fácil  averiguar  que  la 
solución  para  el  campo  eléctrico  es  la  solución  conocida  de  la  electrostática: 

<t>(r)  = - =>  É = = (2.6) 

r r 

Aparte  de  las  simetrías  de  traslaciones  y rotaciones  de  arriba,  el  Principio  de  la  Relatividad 
nos  proporciona  otra,  relacionada  con  observadores  en  movimiento  relativo.  Ya  que  el  Princi- 
pio de  la  Relatividad  impone  que  un  observador  no  es  capaz  de  medir  la  velocidad  absoluta 
de  su  sistema  de  referencia,  sino  solamente  velocidades  relativas  entre  sistemas  de  referencia, 
obviamente  esto  implica  que  las  leyes  de  la  física  no  pueden  ser  formuladas  en  términos  de  ve- 
locidades. Sólo  cambios  de  velocidad  son  admisibles,  ya  que  estos  son  independientes  de  los 
obervadores.  Efectivamente,  las  leyes  de  Newton  están  formulados  en  función  de  la  aceleración 
a,  y no  de  la  velocidad  v. 

Pero  hay  más.  Si  dos  observadores  observan  el  mismo  suceso,  cada  uno  en  su  propio  sistema 
de  referencia,  tiene  que  haber  una  manera  de  relacionar  los  resultados  de  un  observador  con  los 

4 A partir  de  ahora  consideraré  los  conceptos  lagrangiano  y teoría  como  sinónimos:  cada  lagrangiano,  al  ser  la  integral 
de  las  ecuaciones  de  movimiento,  define  los  grados  de  libertad  y dinámica  en  cuestión  y por  lo  tanto  la  teoría  entera.  Vice 
versa  consideraré  que  una  teoría  está  bien  definida  si  existe  un  lagrangiano  que  describe  su  dinámica.  (No  consideraremos 
en  este  libro  los  casos  donde  un  conjunto  de  ecuaciones  de  movimiento  no  son  integrables  a una  acción.) 
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Figura  2.1:  Las  transformaciones  de  Galilei:  Lln  observador  O'  se  mueve  con  velocidad  v con  respecto  a 
un  observador  O,  tal  que  la  posición  de  O'  en  las  coordenadas  de  O es  Ro  + vt.  Una  partícula,  que  tiene 
posición  r'(t)  en  las  coordenadas  de  O1  tendrá  posición  f(t)  = Ro  + r'(t)  + vt  en  las  coordenadas  de  O. 


resultados  del  otro.  La  relación  entre  los  resultados  de  diferentes  observadores  se  llama  cambio  de 
coordenadas.  Las  rotaciones  y las  traslaciones  en  el  tiempo  y el  espacio  son  ejemplos  de  cambios 
de  coordenadas,  pero  por  lo  menos  igual  de  importantes  son  los  cambios  entre  dos  observadores 
que  están  en  movimiento  uniforme  rectilíneo  relativo. 

Consideremos  por  simplicidad  dos  obervadores  O y O'  tienen  sus  sistemas  de  coordenadas 
orientados  de  tal  manera  que  los  ejes  de  sus  coordenadas  cartesianas  son  paralelos.  El  observador 
O'  se  mueve  con  una  velocidad  constante  v con  respecto  al  sistema  de  referencia  de  O,  así  que  la 
posición  del  origen  de  O'  con  respecto  a O en  un  momento  t.  arbitrario  viene  dado  por  lí<,  + vt, 
donde  Ro  es  la  posición  de  O'  a t = 0 en  el  sistema  de  O (véase  Figura  2.1).  Una  masa  m que  se 
encuentra  en  el  momento  t en  la  posición  r ' en  el  sistema  de  coordenadas  de  O',  tendrá  para  O, 
por  la  regla  de  suma  de  vectores,  la  posición 

r = Ro  + r'  + vt.  (2.7) 

Los  observadores  O y O'  podrán  relacionar  sus  mediciones  de  posición  a través  de  estas  transfor- 
maciones, llamadas  las  transformaciones  de  Galilei.  Muchas  veces  se  presentan  para  el  caso  especial 
cuando  los  dos  sistemas  de  referencia  coinciden  a t.  = 0 y O'  se  mueve  a lo  largo  del  eje  x positivo 
de  O (es  decir  R0  = 0 y v = vex).  En  este  caso  (2.7)  se  reduce  a 

x = x'  + vt,  y = y' , z = z' . (2-8) 

Si  la  masa  rn  se  mueve  con  velocidad  V para  O y con  velocidad  V'  para  O' , su  trayectoria 
viene  dada  por  r(t)  = ro  + Vt  en  las  coordenadas  de  O y por  r'(t)  = rf  + n en  coordenadas 
de  O',  donde  ro  y rio1  son  las  posiciones  de  la  masa  en  el  momento  t = 0 en  las  coordenadas  de 
O y de  O'  respectivamente.  Utilizando  (2.7),  vemos  que  las  dos  trayectorias  están  relacionadas  a 
través  de 

r0  + Vt  = R0  + vt  + ro'  + V't.  (2.9) 

Esta  relación  obviamento  no  es  más  que  una  reformulación  de  (2.7)  para  t arbitrario,  pero  su 
interés  está  en  que  nos  permite  encontrar  una  relación  entre  las  velocidades  V y V'  medidas  por 
O y O' . Derivando  (2.9)  con  respecto  al  tiempo,  obtenemos  que  la  velocidad  que  O mide  para  la 
masa  m es  la  suma  de  la  velocidad  que  mide  O'  y la  velocidad  v de  O'  relativa  a O: 

V = v + V'.  (2.10) 

Esta  regla  se  llama  la  regla  (clásica)  de  la  suma  de  las  velocidades  y parece  confirmar  lo  que  conocemos 
intuitivamente  de  la  vida  cotidiana.  Derivando  (2.10)  otra  vez  con  respecto  a t,  vemos  que 

a = a'.  (2.11) 
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En  otras  palabras,  (2.7),  (2.10)  y (2.11)  nos  afirman  los  resultados  conocidos  de  que  en  la  mecánica 
newtoniana  las  posiciones  y las  velocidades  son  relativas,  pero  las  aceleraciones  son  absolutas. 

Como  hemos  visto,  el  Principio  de  la  Relatividad  dice  que  diferentes  observadores  inerciales 
ven  la  misma  física.  Así  que  las  leyes  de  la  física  que  estos  observadores  formulan  tienen  que 
ser  invariantes  bajo  la  transformación  (2.8)  (o  en  general  (2.7)).  Las  transformaciones  de  Galilei, 
junto  con  las  rotaciones  (2.3)  y las  traslaciones  espaciales  (2.2)  y temporales  (2.1)  forman  un  grupo 
(ejerc.),  llamado  el  grupo  de  Galilei.  Como  veremos  en  la  siguiente  sección,  el  grupo  de  Galilei  es 
el  grupo  de  simetrías  de  la  mecánica  newtoniana. 


2.3.  Invariancia  de  la  mecánica  newtoniana  y las  leyes  de  Max- 
well 


Investigaremos  la  invariancia  de  la  segunda  ley  de  Newton  en  el  caso  en  que  las  fuerzas  son 
conservativas,  es  decir  que  son  derivables  de  un  potencial  F = V V . Esto  es  el  caso  para  todas 
las  interacciones  fundamentales,  ya  que  los  efectos  no-conservativos,  como  el  rozamiento,  son 
una  descripción  efectiva  de  interacciones  conservativas  complicadas  a nivel  molecular. 

En  componentes  la  segunda  ley  de  Newton  tiene  la  forma 


dV 

dxj 


(2.12) 


A base  de  conservación  de  momento,  se  puede  demostrar  que  la  masa  m de  una  partícula  tiene 
el  mismo  valor  para  todos  los  observadores.  En  otras  palabras,  la  masa  es  invariante  bajo  cambios 
de  coordenadas,  es  decir,  que  toma  el  mismo  valor  para  todos  los  observadores.  También  hemos 
visto  que  los  potenciales  típicos  de  gravedad,  electromagnetismo  y física  molecular,  atómico  o 
nuclear  son  de  la  forma  V = V(|fi  — f^|),  tal  que  estos  potenciales  son  invariantes  bajo  rotaciones 
y traslaciones.5 

En  el  lado  derecho  de  (2.12)  aparece  la  segunda  derivada  de  la  posición  x1 , de  forma  que  con 
la  regla  de  la  cadena  es  fácil  de  ver  que  la  ecuación  es  invariante  bajo  las  transformaciones  (2.1), 

(2.2)  y (2.7).  En  particular,  el  hecho  de  que  la  segunda  ley  de  Newton  venga  en  función  de  la 
aceleración  y no  de  la  velocidad  es  una  consecuencia  directa  del  Principio  de  la  Relatividad:  si 
aparecieran  velocidades,  habría  que  especificar  con  respecto  a qué  sistema  de  referencia,  mientras 
las  aceleraciones  son  absolutas  en  la  mecánica  newtoniana. 

La  invariancia  bajo  rotaciones  es  un  poco  más  sutil:  derivando  dos  veces  la  transformación 

(2.3)  con  respecto  al  tiempo,  está  claro  que  la  aceleración  transforma  como 


xH  = ]T  i 

3= 1 


(2.13) 


Aunque,  por  ser  un  potencial  central,  V es  invariante  bajo  rotaciones,  su  gradiente  no  lo  es,  de- 
bido a la  transformación  de  las  derivadas.  Aplicando  la  regla  de  la  cadena  tenemos  (o  véase 
Capítulo  4) 


dV 

dx'i 


dV 

dxj' 


(2.14) 


Combinando  (2.13)  y (2.14),  obtenemos  que  si  para  un  observador  es  válida  la  segunda  ley  (2.12), 
otro  observador  relacionado  con  el  primero  a través  de  una  rotación  (2.3)  verá  la  segunda  ley 

5Ojo,  el  hecho  de  que  V sea  invariante  bajo  rotaciones  no  significa  que  VV  lo  sea.  Es  más,  en  seguida  demostraremos 
que  V V no  es  invariante,  sino  que  transforma  de  manera  covariante. 
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como 


(2.15) 


Las  ecuaciones  (2.13)  y (2.14)  dicen  que  los  dos  observadores  obtendrán  resultados  diferentes 
para  las  componentes  de  la  fuerza  y la  aceleración,  pero  cada  uno  medirá,  componente  por  com- 
ponente, que  la  fuerza  es  proporcional  a la  aceleración,  con  la  masa  como  constante  de  proporcio- 
nalidad. Si  la  ley  de  Newton  es  válida  para  un  observador,  también  lo  es  para  el  otro.  Si  objetos 
(y  leyes)  transforman  de  esta  manera  decimos  que  no  son  invariantes  sino  covariantes. 

La  razón  por  la  que  esto  funciona  es  que  tanto  la  fuerza  — VV  como  la  aceleración  x transfor- 
man de  la  misma  manera  bajo  rotaciones.  Ambas  son  vectores  en  R3  y transforman  como  tales 
bajo  el  grupo  0(3)  de  rotaciones  en  R3.  La  lección  que  aprendemos  de  esto  es  que  para  que  las 
leyes  de  la  física  sean  invariantes  o covariantes,  hay  que  expresarlas  en  función  de  objetos  que 
transformen  bien  bajo  el  grupo  de  simetría,  en  este  caso  vectores.  Si  no,  estas  leyes  sólo  tendrían 
sentido  en  un  sistema  de  referencia  específico. 

Con  estos  cálculos  hemos  demostrado  la  invariancia  y covariancia  de  la  mecánica  newtoniana 
bajo  el  grupo  de  Galilei.  El  problema  aparece  cuando  intentamos  averiguar  la  invariancia  del  otro 
pilar  de  la  física  clásica:  el  electromagnetismo  en  forma  de  la  teoría  de  Maxwell.  Las  leyes  de 
Maxwell  vienen  dadas  (en  unidades  de  Lorentz-Heaviside)  por 


S7-E  = p, 


Vx£=  — dfB, 


V • B = O, 

Vx5  = J(j  + dtÉ), 


donde  É y B son  los  campos  eléctricos  y magnéticos  respectivamente,  p la  densidad  de  carga,  j 
la  densidad  de  corriente  y c = 299792, 458  km/s  la  velocidad  de  la  luz.  La  velocidad  de  la  luz 
aparece  porque  la  teoría  de  Maxwell  predice  la  existencia  de  ondas  electromagnéticas  (o  sea  luz), 
que  viajan  con  la  velocidad  c. 

El  hecho  de  que  aparezca  explícitamente  la  velocidad  de  la  luz  es  extraño  porque  parece  vio- 
lar el  Principio  de  la  Relatividad:  c es  la  velocidad  de  la  luz  ¿con  respecto  a qué  observador?  La 
interpretación  generalmente  aceptada  a finales  del  siglo  XIX  era  que  las  ondas  electromagnéti- 
cas necesitaban  un  medio  para  propagarse,  el  éter,  y c sería  entonces  la  velocidad  de  la  luz  con 
respecto  a ese  éter. 

Un  observador  que  se  mueve  con  una  velocidad  v con  respecto  al  éter  mediría  entonces,  por 
la  regla  de  la  sumatoria  de  las  velodicadas  (2.10),  que  la  luz  se  propaga  con  una  velocidad 

c'  = c±v,  (2.17) 

dependiendo  de  si  se  acerca  o se  aleja  de  la  fuente  de  luz.  En  particular,  un  observador  que  se 
mueve  a la  velocidad  de  la  luz  en  la  misma  dirección  que  una  onda  electromagnética,  vería  esa 
onda  como  estática  {d  = 0),  ya  que  estaría  en  reposo  con  respecto  al  observador.  Sin  embargo, 
las  ecuaciones  de  Maxwell  en  el  vacio  (p  — j = 0)  no  permiten  soluciones  de  campos  estáticos, 
al  menos  que  sean  constantes  (ejerc.).  Por  lo  tanto,  ese  observador  vería  una  perfil  del  campo 
electromagnético  que  no  está  permitido  por  las  ecuaciones  de  Maxwell,  lo  que  implica  un  grave 
problema  teórico. 

Pero  también  hay  graves  problemas  experimentales:  entre  1881  y 1930  una  serie  de  experi- 
mentos (de  los  cuales  el  de  los  americanos  Albert  Michelson  (1852  - 1931)  y Edward  Morley  (1838 
- 1923)  de  1887  es  el  más  famoso)  intentaron  determinar  la  velocidad  v de  la  Tierra  con  respec- 
to al  éter,  midiendo  con  mucha  precisión  la  velocidad  de  la  luz  (2.17)  con  respecto  a la  Tierra. 
Sin  embargo  a pesar  de  la  gran  precisión,  los  resultados  siempre  mostraron  (dentro  del  margen 
de  error)  ninguna  diferencia  entre  la  velocidad  de  la  luz  con  respecto  a la  Tierra  y la  velocidad 
con  respecto  al  éter.  En  1907  Albert  Michelson  recibió  el  Premio  Nobel,  no  por  el  resultado  de  su 
experimento,  sino  por  inventar  el  interferómetro  con  que  había  hecho  el  experimento. 
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Para  explicar  los  resultados  experimentales  de  Michelson  y Morley,  el  físico  irlandés  George 
FitzGerald  (1851  - 1901)  e indepedientemente  el  holandés  Hendrik  Antón  Lorentz  (1853-1928) 
propusieron  que  cualquier  objeto  en  movimiento  con  respecto  al  éter  se  contrae  con  un  factor 
i/yr^v  c2  en  la  dirección  del  movimiento.  Aunque  a estas  alturas  la  suposición  era  comple- 
tamente ad  hoc,  sí  explicaba  los  resultados  correctos,  ya  se  supuestamente  los  brazos  del  inter- 
ferrómetro  se  contraen  de  tal  modo  que  cualquier  medición  de  la  velocidad  de  la  luz  siempre 
daría  como  valor  c. 


Lorentz  iba  aún  más  lejos,  dándose  también  cuenta  de  que  las  leyes  de  Maxwell  no  transfor- 
man de  manera  covariante  bajo  las  transformaciones  de  Galilei  (2.7),  sino  bajo  las  transformacio- 
nes 


t — vx/c 2 
\/l  — v2/c2  ’ 


x — vt 
y/l-v2/c2' 


(2.18) 


si  asumimos  que  las  cargas  y las  corrientes  transforman  como 


,/  = P ~ vjx/c2 
y/1  -V2/c2’ 


jx  ~ VP 
y/1  — V2/c2  ’ 


(2.19) 


y los  campos  E y B como 


te 

II 

, Ey-vBz/c 

r = . 

, Ez  + vBy/c 

r / — . 

X -U  7 

V y/l~V2/ó 2 

2 y/l-V2/C 2 

B'  = Bx , 

, By  + vEz/c 

jy!  _ ~ vEy/c 

(2.20) 

X x 5 

V y/1  - V2/C2  ’ 

y/1  — V2/c2 

(ejerc.).  La  transformación  (2.18)  se  llama  la  transformación  de  Lorentz  y difiere  de  la  transformación 
de  Galilei  (2.7)  por  el  factor  1/y/l  — v2 /c2,  que  es  despreciable  cuando  v c,  pero  muy  grande 
cuando  v tiende  a c.  Igual  que  las  transformaciones  de  Galilei,  las  transformaciones  de  Lorentz 
forman  un  grupo  (ejerc.),  llamado  el  grupo  de  Lorentz. 

Parece  por  lo  tanto  que  tenemos  dos  grupos  de  simetría  distintos  en  la  Naturaleza:  el  grupo 
de  Galilei  para  la  mecánica  newtoniana  y el  grupo  de  Lorentz  para  el  electromagnetismo.  Hay 
tres  posibles  actitudes  ante  esta  situación  peculiar: 


1.  Abandonar  el  Principio  de  la  Relatividad:  los  sistemas  inerciales  no  son  todos  equivalentes, 
sino  el  sistema  que  está  en  reposo  con  respecto  al  éter  es  especial,  puesto  que  sólo  aquí  las 
leyes  de  Maxwell  son  válidas. 

2.  Modificar  las  leyes  de  Maxwell,  tal  que  transformen  bien  bajo  las  transformaciones  de  Ga- 
lilei. 

3.  Modificar  la  mecánica  newtoniana,  tal  que  transforme  bajo  las  transformaciones  de  Lorentz 
en  lugar  de  las  de  Galilei. 

La  primera  postura  es  la  que  tomó  Lorentz.  Él  creía  que  su  contracción  de  Lorentz  era  un 
hecho  objetivo,  absoluto  frente  al  sistema  del  éter.  En  cuanto  a la  segunda  postura,  ha  habido 
intentos  de  por  ejemplo  Walter  Ritz  (1878  - 1909)  e incluso  Einstein  en  cierto  momento,  de  derivar 
leyes  electromagnéticas  que  transformen  bajo  el  grupo  de  Galilei,  pero  estas  llevan  a predicciones 
que  fueron  experimentalmente  refutadas. 

La  tercera  opción  es,  como  sabemos,  la  que  elegió  Einstein  en  1905  y es  sin  duda  la  más 
valiente.  Fíjese  que  en  1905  la  mecánica  newtoniana  llevaba  funcionando  con  gran  éxito  ya  más  de 
dos  siglos,  mientras  la  teoría  de  Maxwell  apenas  tenía  40  años  y su  gran  predicción,  la  existencia 
de  ondas  electromagnéticas,  sólo  había  sido  confirmada  por  Hertz  alrededor  de  1890. 
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Einstein  empieza  su  famoso  artículo  Sobre  la  electrodinámica  de  los  cuerpos  en  movimien- 
to, con  una  observación  que  expresa  su  descontento  con  la  intepretación  tradicional  de  algunos 
fenómenos  electromagnéticos:  cuando  un  imán  se  acerca  a un  aro  conductor,  la  ley  la  inducción 
magnética  de  Faraday  explica  la  aparición  de  un  campo  eléctrico  circular  que  induce  una  co- 
rriente en  el  conductor.  Sin  embargo  si  el  conductor  se  acerca  al  imán,  no  hay  ningún  campo 
eléctrico,  pero  la  fuerza  de  Lorentz  F = q(E  + v x B/c)  actúa  sobre  las  cargas  libres  en  el  conduc- 
tor, generando  una  corriente.  A Einstein  le  parecía  raro  estas  dos  explicaciones  distintas,  si  en  el 
fondo  se  trataba  del  mismo  fenómeno,  visto  desde  puntos  de  vistas  diferentes,  y argumentaba  la 
necesidad  de  una  descripción  independiente  del  estado  de  movimiento  del  observador. 

El  resultado  de  la  valiente  postura  de  Einstein  es  lo  que  ahora  conocemos  como  la  teoría  de 
la  relatividad  especial  y aparte  de  llevar  a una  mecánica  relativista,  también  llevó  a un  concepto 
nuevo  de  espacio  y tiempo. 


2.4.  El  Principio  de  la  Relatividad  y el  espacio  absoluto 

Es  curioso,  desde  nuestro  punto  de  vista  moderno  post-relativista,  que  el  Principio  de  la  Re- 
latividad, que  es  tan  importante  en  el  desarollo  de  la  teoría  de  la  relatividad,  no  juegue  ningún 
papel  de  importancia  en  la  mecánica  newtoniana.  Se  mencionan  las  transformaciones  de  Galilei 
(2.8)  en  cualquier  curso  de  física  general,  aunque  más  bien  de  manera  anecdótica,  puesto  que 
luego  no  se  usan  en  ningún  lado.  Se  podría  aprender  y entender  toda  la  física  newtoniana  igual 
de  bien,  sin  conocer  la  simetría  (2.8). 

Gran  parte  de  la  responsabilidad  de  esto  la  tiene  Isaac  Newton  (1642  - 1727),  por  el  énfasis 
que  hizo  sobre  el  espacio,  el  tiempo  y el  movimiento  absolutos.  En  el  Principia  escribe 

"El  tiempo  absoluto,  verdadero  y matemático  [...]  fluye  igualmente  sin  referencia  a algo  externo." 

"El  espacio  absoluto,  en  su  propia  naturaleza,  sin  referencia  a algo  externo,  permanece  siempre  simi- 
lar e inmovible." 

"[E]n  un  barco  de  vela,  la  posición  relativa  de  un  cuerpo  es  aquella  parte  del  barco  [...]  que  el  cuerpo 
ocupa,  y que  por  lo  tanto  se  mueve  junto  con  el  barco.  El  reposo  relativo  es  la  continuación  del  cuer- 
po en  alguna  parte  del  barco  [...].  Pero  reposo  verdadero,  absoluto  es  la  continuidad  del  cuerpo  en 
alguna  parte  del  espacio  absoluto." 

Aunque  Newton  no  necesitaba  recurrir  a estas  ideas  tan  absolutas  para  formular  su  mecánica, 
lo  hizo  porque  no  le  gustaba  el  relativismo  de  René  Descartes  (1596  - 1650),  que  le  olía  a ateísmo. 
Algunos  de  sus  contemporáneos,  como  Gottfried  Leibniz  (1646  - 1716),  han  criticado  mucho  estas 
ideas  absolutas  de  Newton,  pero  según  iba  aumentando  el  éxito  del  Principia  y la  autoridad  de 
Newton,  la  discusión  se  trasladaba  cada  vez  más  a un  plano  filosófico,6  mientras  que  el  signifi- 
cado físico  se  cuestionaba  cada  vez  menos.  Veremos  que  un  proceso  similar  ha  ocurrido  con  la 
idea  de  la  gravedad  como  acción  a distancia,  concepto  cuestionado  por  el  propio  Newton  y sus 
contemporáneos,  pero  generalmente  aceptada  por  generaciones  posteriores. 

A finales  del  siglo  XVIII,  la  autoridad  del  Principia  había  impuesto  una  manera  de  pensar  y 
hacer  física,  de  modo  que  el  Principio  de  la  Relatividad  quedaba  confinado  a un  rincón  olvidado 
de  la  mecánica.  Habría  que  esperar  hasta  el  físico-filósofo  austríaco  Ernst  Mach  (1838  - 1916)  a 
finales  del  siglo  XIX  para  una  primera  crítica  severa  a las  ideas  absolutas  de  Newton.  Como  los 
filósofos  empiristas,  Mach  creía  que  la  única  fuente  de  conocimiento  son  las  impresiones  recibidas 
por  los  sentidos.  Para  él  la  ciencia  era  sólo  un  conjunto  de  hechos  y datos  sacados  de  experimentos 
y observaciones,  y las  leyes  de  la  física,  como  la  del  gas  ideal  o de  la  mecánica  newtoniana,  no  son 

6Por  ejemplo,  los  empiristas  como  George  Berkeley  (1685  - 1753)  y David  Hume  (1711  - 1776)  rechazaban  las  ideas  del 
espacio  y el  tiempo  absolutos  a base  de  que  no  eran  observables  con  los  sentidos,  mientras  que  para  Immanuel  Kant  (1724 
- 1804)  eran  ejemplos  estupendos  de  sus  categorías,  conceptos  innatos  en  el  conocimiento  humano. 
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más  que  maneras  económicas  de  resumir  experiencia.  Sus  ideas  le  hacían  rechazar  ideas  teóricas 
por  no  ser  observables,  como  el  espacio,  el  tiempo  y el  movimiento  absoluto,  pero  también  los 
átomos,  cuya  existencia  nunca  aceptó. 

Pero  el  gran  mérito  de  rescatar  el  Principio  de  la  Relatividad  corresponde,  como  ya  dijimos 
en  la  sección  2.1,  a Poincaré  y a Einstein,  que  lo  declararon  como  primer  principio,  una  idea  cuya 
validez  no  se  puede  demostrar  directamente,  sino  incorporándola  en  una  teoría.  Sin  embargo, 
un  primer  principio  es  más  básico  que  una  teoría,  ya  que  es  independiente  y previo  a la  teoría  y 
puede  ser  implementado  en  teorías  de  varias  maneras.  Lo  que  nos  enseña  la  historia  de  la  teoría 
de  la  relatividad  es  que,  si  hay  un  conflicto  entre  una  teoría  concreta  y un  primer  principio  (en 
este  caso  la  mecánica  newtoniana  y el  Principio  de  la  Relatividad),  en  general  de  lo  que  uno  se 
puede  fiar  es  del  primer  principio. 

Lo  que  hizo  Einstein  fue  introducir  una  nueva  manera  de  hacer  física  teórica.  Hasta  entonces 
un  artículo  teórico  típicamente  empezaba  resumiendo  unos  datos  experimentales  que  no  estaban 
de  acuerdo  con  las  teorías  del  momento  y seguía  proponiendo  un  nuevo  modelo  que  explicaba 
las  discrepancias.  El  artículo  de  Einstein  sobre  la  relatividad  especial,  sin  embargo,  empezaba  con 
la  observación  de  que  tradicionalmente  se  interpreta  la  interacción  entre  una  partícula  cargada 
y un  campo  magnético  de  distinta  manera,  dependiendo  de  si  se  mueve  la  partícula  o el  imán, 
lo  que  está  en  contradicción  con  el  Principio  de  la  Relatividad.  A continuación  introdujo  unos 
postulados  básicos,  como  primeros  principios  y derivó  de  allí  toda  una  nueva  mecánica  y unos 
nuevos  conceptos  de  espacio  y tiempo.  Sólo  al  final  sugirió  dos  maneras  de  verificar  la  nueva 
teoría  experimentalmente:  el  efecto  Doppler  y la  aberración  relativista.  Esta  manera  de  hacer  físi- 
ca teórica  hoy  en  día  todavía  está  considerada  entre  los  físicos  teóricos  una  manera  muy  elegante 
que  se  imita  en  numerosas  ocasiones. 
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Capítulo  3 

Breve  repaso  de  la  relatividad 
especial 


La  relatividad  nos  enseña  la  conexión  entre  las  diferentes  descripciones  de  la  misma  realidad. 
(A.  Einstein) 


3.1.  La  relatividad  del  tiempo  y el  espacio 

Toda  la  teoría  de  la  relatividad  especial  está  basada  en  dos  postulados: 


í.  Todas  las  leyes  de  la  física  son  válidas  para  todos  los  sistemas  inerciales. 

2.  La  velocidad  de  la  luz  en  el  vacío  es  igual  para  todos  los  observadores  y tiene 
el  valor  de  299.792,458  km/ s,  independientemente  del  estado  de  movimiento  de  la 
fuente. 


El  primer  postulado  es  el  Principio  de  la  Relatividad  que  vimos  en  el  capítulo  anterior  y 
que  fue  formulado  ya  por  Galilei  para  la  mecánica  alrededor  de  1600.  Einstein  lo  amplió  para 
todas  las  leyes  físicas,  especialmente  para  el  electromagnetismo,  ya  que,  como  vimos,  la  teoría 
de  Maxwell  parecía  comportarse  de  manera  diferente  a la  mecánica  newtoniana.  El  Principio 
de  la  Relatividad  afirma  que  no  existe  ningún  experimento  físico  que  sea  capaz  de  distinguir 
si  un  observador  está  en  reposo  o en  movimiento  uniforme  rectilíneo.  Dos  observadores  que  se 
mueven  uno  con  respecto  al  otro  ven  la  misma  física  y,  por  lo  tanto,  las  leyes  de  la  física  deben 
escribirse  de  modo  que  no  cambien  al  pasar  de  un  sistema  de  referencia  a otro. 

El  segundo  postulado  es  más  sorprendente,  pero  hay  motivos  teóricos  y experimentales  para 
creerlo.  Los  motivos  experimentales  son  los  experimentos  fracasados  de  Michelson  y Morley 
(1881  y 1887),  que  querían  medir  la  velocidad  de  la  Tierra  con  respecto  al  éter:  suponiendo  que  la 
velocidad  de  la  luz  con  respecto  al  éter  es  c y la  de  la  Tierra  alrededor  del  Sol  es  v,  la  velocidad  de 
la  luz  medida  en  la  Tierra  debería  ser  c — v o c + v,  dependiendo  de  si  se  mide  en  la  dirección  de 
movimiento  de  la  Tierra,  o la  dirección  opuesta.  Los  resultados  experimentales  sin  embargo  no 
lograron  a medir  ninguna  diferencia  de  velocidad,  obteniendo  siempre  el  mismo  valor  para  c.  El 
motivo  teórico  es  la  teoría  de  Maxwell  que  afirma  la  existencia  de  ondas  electromagnéticas  (luz), 
cuya  velocidad  c es  una  constante  predicha  por  la  teoría.  Si  se  asume  que  todas  las  leyes  de  la 
física  son  válidas  para  todos  los  observadores,  hay  que  aceptar  que  c es  una  constante  universal. 
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Figura  3.1:  El  reloj  de  luz  en  un  tren  en  movimiento  visto  por  un  observador  O1  dentro  del  tren  (arriba)  y 
un  observador  O en  el  andén  (abajo). 


Llevar  estos  dos  postulados  hasta  sus  últimas  consecuencias  implica  abandonar  las  ideas  in- 
tuitivas del  espacio  y el  tiempo.  Investigaremos  las  implicaciones  con  una  serie  de  experimentos 
ficticios. 


Considérese  un  tren  que  se  mueve  con  velocidad  v en  movimiento  uniforme  rectilíneo  con 
respecto  al  andén  de  una  estación.  El  pasajero  en  el  tren  O'  dispone  de  un  reloj  de  luz,  que  con- 
siste en  dos  espejos  colocados  uno  encima  del  otro  a una  altura  d y un  pulso  de  luz  que  viaja 
continuamente  entre  los  dos  espejos.  Por  lo  tanto.  O'  medirá  que  el  tiempo  Ai  que  tarda  la  luz  en 
subir  y bajar  entre  los  dos  espejos  es 


(3.1) 


Un  observador  O en  el  andén  verá  este  mismo  fenómeno  de  manera  distinta:  para  él  la  luz 
sale  del  espejo  de  abajo,  pero  llega  al  espejo  de  arriba  después  de  un  tiempo  At/2  cuando  el 
tren  se  ha  desplazado  una  distancia  vAt/2  y otra  vez  al  espejo  de  abajo  después  de  un  tiempo 
total  A t cuando  el  tren  se  ha  desplazado  una  distancia  total  vAt  (véase  Figura  3.1).  Para  O,  la 
luz  recorre  una  trayectoria  más  larga  y,  dado  que  la  velocidad  de  la  luz  es  la  misma  que  para  el 
pasajero,  habrá  pasado  más  tiempo  entre  que  la  luz  saliese  y llegase  otra  vez  al  espejo  de  abajo. 
Concretamente,  la  distancia  que  recorre  la  luz  al  subir  es,  por  el  teorema  de  Pythagoras 


(3.2) 


de  donde  podemos  despejar  A t como 


A t = 


2 d/c 

^l^v2/c2 


A t' 

sj l-V2/c 2’ 


(3.3) 


donde  en  la  última  igualdad  hemos  utilizado  (3.1)  para  relacionar  el  intervalo  Ai  con  el  intervalo 
A t'  medido  por  el  pasajero.  Vemos  por  lo  tanto  que  el  intervalo  de  tiempo  efectivamente  ha  sido 
más  largo  para  el  observador  en  el  andén  que  para  el  pasajero.  Este  efecto  se  llama  la  dilatación 
del  tiempo  y es  completamente  general:  los  relojes  en  movimiento  corren  menos  rápido  que  los 
relojes  en  reposo.  El  factor  de  corrección 


1 

i/l  — v2  / c2 


(3.4) 


es  una  función  creciente  de  v,  que  siempre  es  mayor  que  1.  Obsérvese  sin  embargo  que  para 
velocidades  v <C  c mucho  más  pequeñas  que  la  velocidad  de  la  luz,  tenemos  que  7 « 1,  de  modo 
que  estos  efectos  relativistas  son  completamente  despreciables  en  la  vida  cotidiana. 
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Nótese  que  para  obtener  la  fórmula  (3.3),  hemos  tenido  que  asumir  que  v < c.  La  veloci- 
dad de  la  luz  surge  por  lo  tanto  en  la  relatividad  especial  como  un  límite  máximo,  que  ningún 
observador,  ni  ninguna  señal  puede  superar. 

Finalmente,  es  imprescindible  darse  cuenta  de  que  la  situación  descrita  arriba  es  completa- 
mente simétrica  entre  los  dos  observadores.  El  pasajero  O'  en  el  tren  tiene  pleno  derecho  de 
suponer  que  él  está  en  reposo,  mientras  el  observador  O en  el  andén  se  está  moviendo.  Repitien- 
do el  mismo  argumento,  está  claro  que  O'  verá  el  reloj  de  luz  de  O en  el  andén  avanzar  menos 
rápido  que  el  suyo,  dado  que  para  él  su  propio  reloj  está  en  reposo  (ejerc.). 

Concluimos  por  lo  tanto  que  cada  uno  ve  el  reloj  del  otro  ir  más  lento  que  el  suyo,  puesto  que 
cada  uno  ve  al  otro  en  movimiento.  No  hay  manera  de  saber  cual  de  los  dos  "realmente"  va  más 
lento,  ya  que  esto  depende  del  punto  de  vista  del  observador.  Por  muy  contraintuitiva  que  pueda 
parecer,  esta  situación  no  lleva  a contradicciones,  si  se  toma  en  cuenta  el  hecho  de  que  también 
las  distancias  son  relativas. 

Asumimos  que  el  andén  tiene  una  longitud  L medida  por  O.  Este  puede  escribir  L = vAt, 
donde  Ai  es  el  intervalo  que  necesita  el  tren  para  recorrer  el  andén.  Por  otro  lado.  O'  mide  una 
longitud  L'  = vA t'r  donde  ahora  A t'  es  el  tiempo  entre  que  el  pasajero  pasa  por  el  principio  y el 
final  del  andén,  medido  por  él. 

Dado  que  los  dos  observadores  no  coinciden  en  cuánto  ha  durado  el  intervalo  de  tiempo, 
tampoco  se  pondrán  de  acuerdo  sobre  la  longitud  del  andén.  Para  O',  el  andén  mide 

L'  = vAt'  = vAt\/l  - v2/c2  = L^/l-v2/c2,  (3.5) 

es  decir  una  factor  \Jl  — v2 /c2  más  corto  que  para  O.  Este  efecto  se  conoce  bajo  el  nombre  de  con- 
tracción de  Lorentz:  los  objetos  en  movimiento  sufren  una  contracción  longitudinal  con  un  factor 
7-1.  Otra  vez  la  situación  es  simétrica:  O verá  el  tren  contraído  con  respecto  a la  medición  de  O' 
(ejerc.). 

La  contracción  de  Lorentz  y la  dilatación  del  tiempo  conspiran  para  que  el  conjunto  sea  con- 
sistente. Esto  se  puede  ver  en  el  famoso  experimento  de  los  muones.  Los  muones  son  partículas 
elementales  con  una  vida  media  de  2,2  • 10_6s  (en  reposo),  que  se  forman  a unos  15  km  de  altura 
en  las  colisiones  de  rayos  cósmicos  con  átomos  de  la  atmósfera.  Los  muones  producidos  en  estas 
colisiones  se  mueven  típicamente  con  velocidades  v ~ 0, 99  c. 

Calculando  ingenuamente  la  distancia  que  recorrerían  los  muones  antes  de  desintegrarse, 
multiplicando  su  velocidad  v por  su  tiempo  de  vida  t,  nos  saldría  que  viajan  en  media  unos 
650  m.  En  otras  palabras,  se  desintegran  mucho  antes  de  llegar  a la  superficie  de  la  Tierra.  Sin 
embargo  en  la  práctica  medimos  una  gran  cantidad  de  muones  a nivel  del  mar.  La  explicación 
es  que  por  su  velocidad  relativista,  su  "reloj  interno"  corre  más  lento  debido  a la  dilatación  del 
tiempo.  Al  99  % de  la  velocidad  de  la  luz,  el  factor  de  corrección  vale  7 « 9,  de  modo  que  en 
realidad  viven  unas  9 veces  más  que  un  muón  en  reposo  y una  cantidad  considerable  de  ellos 
sí  llega  a la  superficie. 

La  historia  es  un  poco  diferente  desde  el  punto  de  vista  de  los  propios  muones.  Para  ellos 
su  reloj  corre  al  ritmo  normal  (ya  que  están  en  reposo  con  respecto  a sí  mismos)  y sólo  tienen 
una  vida  media  de  2,2  • 10~6s.  ¿Cómo  podemos  compaginar  esto  con  el  hecho  de  que  gran  parte 
de  ellos  llegan  a la  superficie?  Para  ellos,  la  Tierra  (y  por  lo  tanto  la  atmósfera)  se  mueve  con 
una  velocidad  v ~ 0, 99  c hacia  ellos.  Debido  a este  movimiento,  la  atmósfera  sufre  una  contrac- 
ción de  Lorentz  y parece  9 veces  más  delgada,  unos  1700  m,  suficiente  para  que  una  cantidad 
considerable  llegue  al  suelo. 

Los  efectos  debidos  a la  dilatación  del  tiempo  según  un  observador,  son  debidos  a la  contrac- 
ción de  Lorentz  según  otro.  Esto  indica  una  conexión  íntima  entre  el  espacio  y el  tiempo,  como 
veremos  en  las  siguientes  secciones.  Un  ejemplo  de  esta  conexión  es  la  simultaneidad  de  eventos 
en  dos  puntos  distintos  del  espacio. 
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Figura  3.2:  La  simultaneidad  de  eventos:  una  fuente  de  luz  emite  señales  hacia  dos  detectores  ai/b,  co- 
locados al  principio  y al  final  del  tren.  Para  O'  las  dos  señales  llegan  simultáneamente  a los  detectores, 
mientras  segíin  O la  señal  llega  primero  al  detector  b y después  al  detector  a. 


Una  fuente  de  luz,  colocada  en  el  medio  del  tren,  emite  dos  señales  hacia  dos  detectores  a y 
b al  principio  y al  final  del  tren  respectivamente  (Véase  Figura  3.2).  Para  el  pasajero  en  el  tren  O' 
las  señales  llegarán  al  mismo  momento  a los  detectores,  puesto  que  cada  una  de  las  señales  tarda 
un  tiempo  A t'  = 1/ 2c,  donde  l es  la  longitud  del  tren  en  reposo. 

El  observador  O en  el  andén,  sin  embargo,  ve  también  moverse  las  señales  con  la  velocidad  c, 
pero  además  ve  que  el  detector  b se  aproxima  con  una  velocidad  v a la  señal,  mientras  el  detector 
a se  aleja  con  velocidad  v.  Para  él  las  señales  tardan  un  tiempo 


A ta 


ly/1  — v2/c2 
2 (c  — v) 


y 


Atb 


l\J  1 — v2/  c2 
2(c  + v) 


(3.6) 


en  llegar  a los  detectores  a y b respectivamente.  Para  O,  la  llegada  de  la  señal  al  detector  a no 
es  simultánea  a la  llegada  de  la  señal  al  detector  b,  sino  que  ocurre  después  de  un  intervalo  de 
tiempo 

Ata  — Atb  = — 7=====-  (3.7) 

y 1 — vz ¡cz 

Sucesos  que  son  simultáneos  para  un  observador,  no  necesariamente  lo  son  para  otro.  Incluso  es 
posible  encontrar  observadores  O"  para  los  cuales  primero  llega  la  señal  en  o y después  en  b,  es 
decir,  para  los  cuales  el  orden  de  los  sucesos  es  invertido  con  respecto  a O:  un  observador  que  se 
mueve  en  la  misma  dirección  que  el  tren,  pero  con  velocidad  V > v con  respecto  al  andén  ve  el 
tren  moverse  hacia  atrás  y por  lo  tanto  el  detector  a acercarse  a la  señal,  mientras  b se  aleja. 

El  hecho  de  que  podamos  encontrar  distintos  observadores  que  ven  un  suceso  A antes,  a la 
vez,  o después  de  un  suceso  B,  ¿puede  causar  problemas  de  causalidad?  No,  la  relatividad  es 
estrictamente  causal.  Sólo  es  posible  invertir  el  orden  de  sucesos  que  no  están  en  contacto  causal, 
es  decir  para  los  cuales  no  da  tiempo  a mandar  una  señal  de  luz  entre  uno  y otro.  Esto  se  hará  más 
claro  cuando  introducimos  el  concepto  de  conos  de  luz  en  la  sección  3.5. 


3.2.  Las  transformaciones  de  Lorentz 


Nótese  que  todos  los  efectos  relativistas  derivados  anteriormente  (la  dilatación  del  tiempo, 
la  contracción  de  Lorentz  y la  no-simultaneidad  de  sucesos)  son  debidos  al  segundo  postulado: 
la  constancia  de  la  velocidad  de  la  luz.  El  primer  postulado,  la  equivalencia  de  los  observadores 
inerciales  nos  dirá  cómo  relacionar  las  mediciones  de  un  observador  con  las  de  otro. 
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Figura  3.3:  Dos  sistemas  de  referencia  O y O'  se  mueven  con  una  velocidad  relativa  v.  Los  sistemas 
de  referencia  están  orientados  tal  que  los  ejes  son  paralelos  y los  relojes  están  sincronizados  tal  que  en 
t = t'  = O los  orígenes  coinciden.  Debido  a la  constancia  de  la  velocidad  de  la  luz,  una  señal  luminosa, 
emitida  en  todas  las  direcciones  desde  el  origen  en  el  momento  t = t'  = O,  será  esférica  en  ambos  sistemas 
de  referencia. 


Un  evento  es  algo  que  ocurre  en  cierto  lugar  del  espacio  en  cierto  momento.  Un  observador 
O medirá  este  suceso  en  su  sistema  de  referencia  y puede  asignarle  4 coordenadas  (, x,y,z,t ). 
Otro  observador  O'  verá  el  mismo  suceso  y le  asignará  las  coordenadas  (x/ , y' ,z',t')  en  su  propio 
sistema  de  referencia.  La  pregunta  es:  ¿cómo  los  dos  observadores  se  pueden  poner  de  acuerdo 
sobre  sus  mediciones?  En  otras  palabras,  ¿cómo  están  relacionadas  las  coordenadas  (x,  y,  z,  t)  y 
(xr,  y' , z' , t'),  si  O'  se  mueve  de  manera  uniforme  y rectilínea  con  velocidad  v con  respecto  a O ? 
Por  simplicidad  supondremos  que  los  sistemas  de  referencia  de  O y O'  están  orientados  de  modo 
que  los  ejes  son  paralelos  y que  O'  se  mueve  a lo  largo  del  eje  x de  O.  Además,  supondremos  que 
en  t = t!  = 0 los  dos  orígenes  de  los  sistemas  de  referencia  coinciden  (Véase  Fig  3.3). 

La  mecánica  newtoniana  (y  nuestra  intuición)  dice  que  la  relación  entre  los  dos  sistema  de 
referencia  viene  dada  por  las  transformaciones  de  Galilei  (2.8) 

x'  = x — vt,  y'  = y,  zl  = z,  t!  = t.  (3-8) 

Sin  embargo,  es  fácil  de  ver  que  estas  transformaciones  no  respetan  el  segundo  postulado  de  la 
constancia  de  la  velocidad  de  la  luz.  Como  consecuencia,  las  transformaciones  de  Galilei  están 
en  contradicción  con  los  resultados  derivados  en  la  sección  anterior,  en  particular  con  la  formula 
(3.3)  de  la  dilatación  del  tiempo.  Necesitamos  por  lo  tanto  derivar  unas  transformaciones  nuevas 
que  respeten  el  segundo  postulado  y reproduzcan  los  resultados  de  la  sección  anterior. 

La  transformación  lineal  más  general1  entre  (x,  t)  y (x' , t')  (suponiendo  que  y’  = y y z'  = z, 
dado  que  la  contracción  de  Lorentz  sólo  es  longitudinal)  es 

x'  = Ax  + Bt,  t!  = Cx  + Dt,  (3.9) 

donde  los  coeficientes  A,  B,  C y D son  funciones  de  v y c.  A base  de  consideraciones  generales  de 
simetría,  podemos  relacionar  algunos  de  los  coeficientes.  El  origen  del  sistema  O está  en  reposo 
con  respecto  a este  sistema  y satisface  por  lo  tanto  en  cada  momento  la  condición  x = 0.  Las 
transformaciones  (3.9)  en  este  caso  se  reducen  a 

x'  = Bt,  t'  = Dt,  (3.10) 

'En  su  famoso  artículo  "Sobre  la  electrodinámica  de  cuerpos  en  movimiento"  en  que  presenta  su  teoriá  de  la  relatividad 
especial,  Einstein  decía  que  "está  claro  que  las  ecuaciones  deben  ser  lineales  debido  a las  propiedades  de  homogeneidad 
que  le  asignamos  al  espacio  y al  tiempo. " Probablemente  lo  que  quería  decir  es  que  esperaba  que  las  transformaciones 
fueran  las  mismas  en  todos  los  puntos  del  espacio  y por  lo  tanto  la  matriz  de  transformación  una  matriz  constante. 
Veremos  a partir  del  Capítulo  6 lo  que  ocurre  si  en  vez  de  transformaciones  globales  consideramos  transformaciones 
locales. 


48 


(3.11) 


y,  derivando  la  primera  ecuación  con  respecto  a t' , tenemos 

-v  = B/D , 


donde  —v  = dx' ¡dt'  es  la  velocidad  con  la  que  O'  ve  moverse  el  origen  de  O. 

De  manera  similar,  el  origen  de  O'  está  en  reposo  con  respecto  a si  mismo,  de  modo  que  x'  = 0 


y 

o,  derivando  con  respecto  a t, 

Comparando  (3.11)  y (3.13)  vemos  que  A 

x'  = A(x  — vt), 


Ax  + Bt  = 0,  (3.12) 

Av  + B = 0.  (3.13) 

= Dy  B = —vA,  de  modo  que  (3.9)  se  convierte  en 

t'  = A{C/Ax  + t).  (3.14) 


Para  determinar  Ay  C,  consideramos  el  siguiente  suceso:  en  el  momento  t = t'  = 0 (cuando 
los  orígenes  de  ambos  sistemas  de  referencia  satisfacen  la  condición  x = x'  = 0),  uno  de  los 
observadores  emite  una  señal  de  luz  desde  el  origen,  que  se  expande  en  una  esfera  (véase  Figura 
3.3).  Después  de  un  tiempo  t un  punto  en  la  esfera  tendrá  para  O unas  coordenadas  que  satisfacen 

x2  + y2  + z2  = (ct)2 . (3.15) 


Para  O',  la  luz  también  se  expande  en  una  esfera,  dado  que  la  velocidad  de  la  luz  es  igual  para 
los  dos,  según  el  segundo  postulado,  sólo  que  para  O'  las  coordenadas  satisfarán 

x'2+y,2  + z,2  = (ct')2.  (3.16) 


Dado  que  y = y'  y z = z' , vemos  que  una  condición  de  consistencia  para  las  transformaciones 
(3.14)  es  que 


(i ct )2  — x2  = ( ct ’)2  — x'2. 

Sustituyendo  (3.14),  encontramos  para  los  valores  de  los  coeficientes 

1 „ —v/c2 


A = 


y/l  — v2 /c2 


C = 


— v2 /c2 


(3.17) 

(3.18) 


Vemos  por  lo  tanto  que  las  transformaciones  (3.9)  entre  observadores  O y O'  que  respetan  los  dos 
postulados  de  la  relatividad  son  de  la  forma 

i = tyvxlc‘  x'  = X~Vt  (3.19) 

y/1  -V2/c2  y/1  — W2/c2 

Las  transformaciones  (3.19)  se  llaman  las  transformaciones  de  Lorentz  y se  reducen  para  v <C  c a las 
transformaciones  de  Galilei  (3.8)  (por  esto  la  mecánica  newtoniana  es  válida  a velocidades  coti- 
dianas). Obsérvese  que  las  transformaciones  (3.19)  fueron  construidas  de  tal  manera  que  dejaran 
la  cantidad 

s2  = (ct)2  - x2  - y2  - z2  (3.20) 

invariante  (ejerc.).  Dejamos  como  ejercicio  derivar  que  las  transformaciones  de  Lorentz  reprodu- 
cen exactamente  los  efectos  relativistas  de  la  sección  3.1. 


3.3.  Dinámica  relativista 


Al  derivar  las  transformaciones  de  Lorentz  hemos  tenido  que  asumir  que  el  factor  /l  — v2 /c2 
es  real,  es  decir,  que  la  velocidad  relativa  entre  dos  observadores  siempre  es  menor  que  la  velo- 
cidad de  la  luz,  v < c,  si  no  las  transformaciones  (3.19)  no  están  bien  definidas.2  Más  general, 

2Esto  elimina  el  problema  del  capítulo  anterior,  donde  un  observador  que  se  mueve  junto  con  una  onda  electro- 
magnética vería  un  perfil  de  campo  electromagnético  no  permitido  por  las  ecuaciones  de  Maxwel.  Ahora  vemos  que  tal 
observador  no  existe,  ya  que  para  eso  debería  viajar  con  la  velocidad  de  la  luz. 
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las  transformaciones  de  Lorentz  implican  que  la  velocidad  de  una  partícula  en  un  sistema  de 
referencia  dada  siempre  tiene  que  ser  menor  que  (o,  en  caso  de  partículas  sin  masa,  igual  a)  la 
velocidad  de  la  luz.  En  otras  palabras,  la  velocidad  de  la  luz  aparece  en  relatividad  especial  como 
un  límite  superior  a cualquier  velocidad  permitida,  una  limitación  que  en  la  mecánica  newtonia- 
na  no  aparece.3  Habrá  que  modificar  por  lo  tanto  la  mecánica  newtoniana  de  modo  que  respete 
este  límite  de  velocidad. 


Una  primera  observación  es  que  la  regla  de  la  suma  de  las  velocidades  V = V'+v  no  puede  ser 
cierta,  ya  que  permite  velocidades  mayores  que  c.4  De  las  transformaciones  de  Lorentz  podemos 
derivar  una  regla  nueva  para  la  composición  de  las  velocidades. 

Una  partícula  tiene  una  velocidad  V'  con  respecto  al  observador  O' , que  a su  vez  se  mueve 
con  velocidad  v con  respecto  a O.  Para  calcular  la  velocidad  V de  la  partícula  con  respecto  a O, 
utilizamos  la  inversa  de  las  transformaciones  de  Lorentz 


x = 7 (x'  + vt'),  t = 7 (t'  + vx’ /c2), 


(3.21) 


donde  7 es  el  factor  relativista,  dado  por  (3.4).  La  velocidad  V = dx/dt  viene  dada  por 


V = 7 


/ dx  di! 

( v~r 

V di  di 


7 (V'  + v) 


dt' 

dt 


V+v 


(3.22) 


donde  en  la  segunda  igualdad  hemos  utilizado  la  regla  de  la  cadena 

<h!_  = dx!_dd!_  =y,<M_  (323) 

dt  dt'  dt  dt 

Es  fácil  de  ver  que  con  esta  regla  relativista  de  la  suma  de  velocidades  (3.22),  las  velocidades  medidas 
por  O nunca  exceden  la  velocidad  de  la  luz.  Obsérvese  que  incluso  en  el  caso  donde  una  partícu- 
la (sin  masa)  se  mueve  con  velocidad  V’  = c con  respecto  al  observador  O',  su  velocidad  con 
respecto  al  obervador  O según  la  regla  (3.22)  es  L = c,  independientemente  de  la  velocidad  v 
relativa  entre  O y O!  Esto  nos  dice  que  la  nueva  regla  de  composición  de  velocidades  respeta  la 
constancia  de  la  velocidad  de  la  luz,  exigido  por  el  segundo  postulado  de  la  relatividad  especial. 


La  segunda  ley  de  Newton,  F = ma  tampoco  puede  ser  válida,  puesto  que  implicaría  que  una 
partícula  sometida  a una  fuerza  constante  podría  alcanzar  velocidades  arbitrariamente  grandes. 
Habrá  que  modificar  por  lo  tanto  la  segunda  ley,  de  modo  que  no  viole  los  postulados  o las 
transformaciones  de  Lorentz. 


Se  puede  reescribir  la  segunda  ley  de  Newton,  definiendo  la  fuerza  F como  la  derivada  del 
momento  p con  respecto  al  tiempo 

' df  (3.24) 


F = 


dt 1 


sólo  que  ahora  el  momento  p no  es  simplemente  mo  i?,  con  mo  la  masa  de  la  partícula  (en  reposo),5 
sino 


P = 


m qV 


1 — v2/c2 


(3.25) 


3 En  2011,  los  científicos  trabajando  en  el  experimento  de  OPERA  en  Gran  Sasso  (Italia)  anunciaron  una  anomalía  en 
sus  datos  experimentales  potencialmente  revolucionaria:  unos  neutrinos  viajando  con  velocidades  (ligeramente)  mayores 
que  la  velocidad  de  la  luz.  Midiendo  la  velocidad  de  un  haz  de  neutrinos  producidos  en  el  CERN  en  Ginebra  (Suiza)  y 
enviados  a Gran  Sasso,  731  km  más  lejos,  parecían  encontrar  que  los  neutrinos  llegaban  60  nanosegundos  antes  de  que 
si  hubieran  viajado  con  la  velocidad  de  a luz  en  el  vacio.  Aunque  inicialmente  afirmaron  que  el  error  experimental  sobre 
esta  medida  era  de  20  nanosegundos  (por  lo  tanto  desafiando  uno  de  los  principios  claves  de  la  relatividad  especial),  un 
análisis  más  exhaustivo  relevó  que,  debido  a un  cable  de  fibra  óptica  mal  colocado,  la  barra  de  error  real  era  más  grande, 
concretamente  de  150  nanosegundos,  volviendo  los  resultados  experimentales  compatibles  con  la  relatividad  especial. 

4Nótese  de  que  al  derivar  la  regla  de  la  suma  de  las  velocidades  (2.10)  hemos  supuesto  implícitamente  que  el  tiempo 
era  el  mismo  para  los  dos  observadores,  t = t',  cosa  que  ahora  sabemos  que  no  es  verdad. 

5 A veces  se  encuentra  en  los  libros  divulgativos  en  concepto  de  masa  relativista  mr  = mo  / y/l  — v1  ¡c2 , sugeriendo 
que  la  masa  de  un  objeto  depende  de  su  velocidad.  Esta  notación  ahora  está  considerado  anticuado  y suele  llevar  a 
confusiones  y errores  conceptuales,  por  lo  que,  como  en  la  gran  mayoría  de  los  libros  de  texto  modernos,  sólo  usaremos 
la  masa  invariante  mo . 
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El  factor  7 en  esta  definición  del  momento  da  correcciones  relativistas  importantes  a la  mecánica 
newtoniana.  Nótese  por  ejemplo  que  de  este  modo  una  fuerza  nunca  podrá  acelerar  una  masa  a 
velocidades  más  grandes  que  c,  puesto  que  si  v ~ c,  hace  falta  una  fuerza  cada  vez  más  grande 
para  conseguir  un  aumento  cada  vez  más  pequeño  en  la  velocidad. 

En  analogía  con  la  mecánica  newtoniana,  definimos  la  diferencia  de  la  energía  cinética  E como 
el  trabajo  realizado  por  la  fuerza  F a lo  largo  de  una  curva  C 


E2-E1  = í F-dr  = í F ■ vdt.  (3.26) 

Je  Je 

Utilizando  la  versión  relativista  de  la  segunda  ley  (3.24),  podemos  escribir  la  energía  cinética 
como 

. í2  _ dp  f2  _ dpdj  2 [2dj  2 

A E = v ■ —dt  = I v ■ — — —dt  = m0c  / —dt  = m^c  A7  (3.27) 

J 1 dt  J 1 (17  dt  J 1 dt 

donde  en  la  tercera  igualdad  hemos  utilizado  que 

dp  _ d ( \ 2 dv  2 c2  1 

v ■ — = v * — — ( mo'yv  ) = mov  +mo”/v—  = mov  +mo = rrioc  . (3.28) 

d'y  dj  V / (¡¡7  7^ 

La  ecuación  (3.27)  da  una  relación  entre  la  energía  cinética  E,  la  masa  mo  y la  velocidad  v que 
difiere  bastante  de  la  expresión  newtoniana: 


E = 


moc2 

\/l  — v2/c2 


(3.29) 


Sin  embargo,  a bajas  velocidades  v c,  se  puede  desarollar  el  factor  relativista  en  un  desarrollo 
de  Taylor 

E ns  moc2  + ^mov2  + ...  (3.30) 

de  modo  que  en  el  segundo  término  reconocemos  la  expresión  newtoniana  para  la  energía  cinéti- 
ca, mientras  el  primer  término  es  la  energía  de  reposo  que  tiene  un  objeto  simplemente  por  te- 
ner masa.  Los  puntos  suspensivos  dan  correcciones  relativistas  a la  expresión  newtoniana  de  la 
energía  cinética. 

El  hecho  de  que  la  energía  de  una  partícula  dependa  de  la  velocidad,  sugiere  una  relación 
profunda  entre  la  energía  y el  momento.  Un  observador  O'  que  está  en  reposo  respecto  a la 
partícula  verá  una  energía  E'  = rriQC 2 y un  momento  p 1 = 0,  mientras  que  el  observador  O 
verá  un  momento  no-nulo  y una  energía  más  grande.  Resulta  que  E y p están  relacionados  a 
través  de  una  transformación  de  Lorentz  (suponiendo  que  los  sistemas  de  O y O'  están  orientados 
como  en  la  sección  anterior  y que  la  masa  se  mueve  a lo  largo  del  eje  x de  O): 


E - vpx 
s/l-v2/^ 


, _ px  - vE/ c2 

’X  ~ y/1  ~ V2/C2  ' 


(3.31) 


Finalmente,  podemos  combinar  E y p en  una  expresión.  De  (3.25)  y (3.29)  tenemos  que 


íti2  2 2 2 2 2 2 2 4 

E PXC  PyC  Pzc  TRqC  . 


(3.32) 


Obsérvese  que  el  lado  derecho  es  una  constante,  de  modo  que  la  combinación  a la  izquierda 
tiene  el  mismo  valor  para  todos  los  observadores.  Observe  la  similitud  con  la  fórmula  (3.17)  de 
la  distancia  recorrida  por  la  luz  en  un  intervalo  de  tiempo. 

En  contraste  con  la  mecánica  newtoniana,  la  teoría  de  Maxwell  del  electromagnetismo  no 
necesita  correcciones  relativistas,  puesto  que  las  leyes  de  Maxwell  ya  son  invariantes  bajo  las 
transformaciones  de  Lorentz. 


51 


Las  leyes  de  Maxwell 


V • É = p,  V • B = O,  (3.33) 

Vx£  = ^-3 tB,  V x B=  -(j  + dtÉ),  (3.34) 

c c V / 


junto  con  la  fuerza  de  Lorentz 


F = e[E 


v x B 


(3.35) 


describen  las  interacciones  de  campos  eléctricos  É,  magnéticos  B,  densidades  de  cargas  p y den- 
sidades de  corrientes  j.  Una  de  sus  consecuencias  es  la  ley  de  conservación  de  la  carga 


dtp  + V • j = 0. 


(3.36) 


Está  claro  que  el  Principio  de  la  Relatividad  relaciona  ciertas  magnitudes  que  aparecen  en 
las  leyes  de  Maxwell.  Por  ejemplo,  una  corriente  no  es  más  que  carga  en  movimiento,  j = pv, 
de  modo  que  lo  que  para  un  observador  O parece  una  corriente,  es  una  carga  estática  para  el 
observador  O'  que  viaja  con  la  misma  velocidad  v que  la  carga.  Cargas  y corrientes  están  por  lo 
tanto  relacionadas  a través  de  una  transformación  de  Lorentz  (suponiendo  que  los  sistemas  de  O 
y O'  están  orientados  como  en  la  sección  anterior  y que  la  carga  se  mueve  a lo  largo  del  eje  x), 


n,  __  P - vjx/c2  = jx  ~ vp 

P ~ y/1  -í;2/c2’  Jx~  y/1  -v2/c2' 


(3.37) 


Obsérvese  que  la  ley  de  conservación  de  carga  (3.36)  es  invariante  bajo  las  transformaciones  de 
Lorentz  (3.19)  y (3.37)  (ejerc.).  La  conservación  de  la  carga  es  por  lo  tanto  válida  para  todos  los 
observadores,  tal  como  esperaríamos  de  una  propiedad  tan  importante. 

Según  la  ley  de  Gauss  (3.33a),  una  carga  estática  causa  un  campo  eléctrico  estático,  mientras  la 
ley  de  Ampére  (3.34b)  dice  que  una  corriente  causa  un  campo  magnético.  Por  lo  tanto  al  pasar  la 
carga,  O verá  un  campo  magnético  que  está  ausente  para  O'.  Esto  es  posible  porque  los  campos 
E y B se  transforman  bajo  una  transformación  de  Lorentz  como 


EL  = Er 


XI 


. = Ey-vBz/c 
v ^1-v 2/c2’ 

_ By  + vEz/c 
y~  \Jl  - v2/c2  ’ 


Ez  + vBy/c 

y/1  -U2/C2’ 

Bz  - vEy/c 

y/1  ~V2/C2' 


(3.38) 


Es  un  ejercicio  instructivo  comprobar  que  las  ecuaciones  de  Maxwell  transforman  de  manera 
covariante  bajo  las  transformaciones  (3.19),  (3.37)  y (3.38). 

De  las  ecuaciones  homogéneas  de  Maxwell  (3.33b)  y (3.34a)  sabemos  que  existen  potenciales 
electromagnéticos  4>y  A,  tales  que 


É = -V0  - -dtÁ,  B = VxÁ,  (3.39) 

c 

y que  podemos  escribir  las  ecuaciones  inhomogéneas  de  Maxwell  (3.33a)  y (3.34b)  como 

- V2(j)  = p,  b d2tÁ  - V2A  = -J,  (3.40) 

si  suponemos  que  <f>  y A satisfacen  el  gauge  de  Lorenz 

- dt(¡>  + V • A = 0.  (3.41) 

c 
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No  es  de  extrañar  por  lo  tanto  que  también  los  potenciales  se  transformen  bajo  las  transforma- 
ciones de  Lorentz 


4>  - vAx/c  A,  _ Ax  - v<j>/c 

Vi  - V2/c 2 ’ x “ Vi  -v2/c2' 


(3.42) 


También  es  un  ejercicio  instructivo  demostrar  que  la  condición  de  Lorenz  (3.41)  es  invariante6 
y que  las  ecuaciones  (3.40)  son  covariantes  bajo  las  transformaciones  de  Lorentz  (3.19),  (3.37)  y 
(3.42)  y que  se  recupera  las  transformaciones  (3.38)  desde  (3.42)  y (3.39). 


3.4.  La  fuerza  de  Lorentz  y el  Principio  de  la  Relatividad 


Puede  resultar  sorprendente  que  en  la  expresión  (3.35)  aparezca  explícitamente  la  velocidad 
v de  la  partícula  sometida  a la  fuerza  de  Lorentz,  sobre  todo  después  de  la  énfasis  que  hemos 
dado  en  el  capítulo  anterior  al  Principio  de  la  Relatividad.  Parece  que,  para  que  tenga  sentido  la 
expresión,  habrá  que  especificar  con  respecto  a qué  sistema  de  referencia  se  mide  esta  velocidad, 
violando  así  por  lo  tanto  un  primer  principio  que  creíamos  fundamental. 

Sin  embargo,  curiosamente  la  expresión  (3.35)  para  la  fuerza  de  Lorentz  es  válida  en  todos  los 
sistemas  inerciales,  ya  que  no  sólo  cambia  v al  cambiar  de  sistema  de  referencia,  sino  también  E y 
B,  como  acabamos  de  ver.  No  nos  sorprenderá  por  lo  tanto  que  la  combinación  (3.35)  transforma 
adecuadamente  bajo  una  transformación  de  Lorentz. 

Una  bonita  ilustración  de  esta  propiedad  podemos  obtener  si  analizamos  el  conocido  efecto 
de  las  fuerzas  entre  dos  conductores  paralelos  desde  dos  puntos  de  vista  diferentes:  desde  el 
sistema  de  referencia  del  laboratorio,  en  el  cual  una  corriente  corre  por  los  conductores,  y desde 
el  sistema  que  está  en  reposo  con  respecto  a los  electrones  y en  el  que  se  mueve  el  conductor. 
La  fuerzas  que  actúan  sobre  el  sistema  son  las  mismas,  pero  la  interpretación  en  cada  sistema  es 
diferente  (que  es,  como  hemos  visto  ya,  la  esencia  de  la  teoría  de  la  relatividad). 

En  1820  Ampére  demostró  ante  la  Academia  de  Ciencias  de  París  que  dos  conductores  para- 
lelos, por  los  que  pasan  corrientes,  experimentan  una  fuerza  atractiva  si  las  corrientes  en  ambos 
conductores  van  en  el  mismo  sentido  y una  fuerza  repulsiva  si  tienen  sentidos  opuestos.  Visto 
desde  el  sistema  de  referencia  del  experimentador,  la  situación  es  bastante  sencilla:  los  conducto- 
res están  hechos  de  iones  de  cobre  fijos  (cargados  positivamente)  y electrones  móviles  (cargados 
negativamente),  cuyo  movimiento  (que  supondremos  uniforme  y rectilineo)  causa  las  corrientes 
(véase  Figura  3.4).  Puesto  que  los  conductores  son  eléctricamente  neutros,  las  densidades  de  las 
cargas  positivas  y negativas  tienen  que  ser  las  mismas  (módulo  el  signo  de  la  carga):  p+  = — p_. 
Por  lo  tanto  los  conductores  no  generan  un  campo  eléctrico,  pero  cada  una  de  las  corrientes  ge- 
nererá  un  campo  magnético  del  tipo  (1.32),  que  afecta  a los  electrones  moviéndose  en  el  otro 
conductor.  Un  electrón  (con  carga  — e < 0),  que  se  mueve  con  una  velocidad  v dentro  de  un 
conductor,  nota  una  fuerza  de  magnetostática 


F = -e 


v x B 
c 


(3.43) 


donde  B es  el  campo  magnético  causado  por  la  corriente  I en  el  otro  conductor.  Es  fácil  de  com- 
probar que  la  fuerza  es  atractiva  si  v y I son  antiparalelos  (es  decir,  si  las  dos  corrientes  tienen  el 
mismo  sentido)  y repulsiva  si  P y / son  paralelos  (si  las  corrientes  van  en  direcciones  opuestas).7 

6 El  gauge  de  Lorenz  recibe  su  nombre  por  Ludwig  Lorenz  (1829-1891),  el  físico  danés  que  lo  introdujo  en  1867  y no 
por  H.A.  Lorentz,  el  físico  holandés,  conocido  por  la  fuerza  de  Lorentz  y el  grupo  de  Lorentz.  La  jugada  graciosa  de  la 
Historia  es  que  el  particular  interés  del  gauge  de  Lorenz  está  en  el  hecho  de  que  es  invariante  Lorentz. 

7Escribiremos  la  corriente  I en  términos  de  p+.  Es  bien  conocido  el  error  histórico  del  científico  y político  estadou- 
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Desde  el  sistema  de  referencia  de  los  electrones  se  ve  la  situación  distinta,  además  hay  que 
distinguir  entre  el  caso  de  las  corrientes  paralelas  y antiparalelas.  Si  las  dos  corrientes  van  en  la 
misma  dirección,  entonces  desde  en  punto  de  vista  del  sistema  de  los  electrones,  los  electrones  de 
los  dos  conductores  están  en  reposo,  mientras  que  los  iones  se  mueven  con  una  velocidad  —ti.  En 
este  sistema  de  referencia,  las  distancias  entre  los  iones  están  contraidas  con  un  factor  y/1  — v2/c2 
por  la  contracción  de  Lorentz,  de  modo  que  la  densidad  de  carga  posiva  p'+  es  más  alta  que  en  el 
sistema  de  laboratorio,8 


P+  = 


P+ 


y/1  - v2/c 


(3.44) 


Por  otro  lado,  la  densidad  de  carga  negativa  p'_  en  este  sistema  es  más  baja  que  en  el  sistema  de 
laboratorio,  ya  al  estar  en  reposo  ya  no  sufren  la  contracción  de  Lorentz  que  experimentaban  en 
el  sistema  de  laboratorio.  Concretamente  tenemos  que 


f>-  = P-  V1  -v2/c2, 


(3.45) 


y por  lo  tanto  la  densidad  de  carga  total  de  un  conductor  visto  por  un  electrón  en  el  otro  es 


Ptot  — P+  + P-  — 


p+ 


y/l~  V2/c2 


+ p _ y/ 1 — v2/c2  = 


Po  V2/c 


y/1  - V2/C2  ’ 


(3.46) 


donde  en  la  última  igualdad  hemos  utilizado  que  en  el  sistema  de  laboratorio  p+  = -p-  = po-  En 
otras  palabras  un  electrón  en  un  conductor  verá  que  el  otro  conductor  tiene  una  carga  eléctrica 
neto  positiva  y que  su  campo  eléctrico  ejerce  una  fuerza  atractiva  sobre  él 


F = —eÉ. 


(3.47) 


Obviamente  el  electrón  nota  también  el  campo  magnético  de  la  corriente  de  iones  en  el  otro 
conductor,  pero  ese  campo  magnético  no  ejerce  ninguna  fuerza  sobre  él,  ya  que  está  en  reposo  en 
su  propio  sistema  de  referencia. 

Si  las  dos  corrientes  son  antiparalelas,  la  situación  es  un  poco  más  complicada:  un  electrón  ve 
moverse  a los  iones  en  el  otro  conductor  con  una  velocidad  —v  y nota  por  lo  tanto  una  densidad 
de  carga  positiva  como  en  (3.44).  Pero  también  ve,  por  la  regla  de  sumatorio  de  velocidades  (3.22), 
a los  electrones  moverse  con  una  velocidad  V = ‘2v/ ( 1 + vl  ¡ cl")  y por  lo  tanto  las  distancias  entre 
éstos  aún  más  Lorentz  contraídos  que  los  iones.  La  densidad  de  carga  negativa  es  por  lo  tanto 
más  alta  que  la  positiva,  y el  otro  conductor  tiene  una  densidad  de  carga  global  negativa,  lo  que 
resulta  en  una  fuerza  electrostática  repulsiva. 

Por  lo  tanto  vemos  que  la  fuerza  que  actúan  sobre  un  electrón  en  un  conductor  es  puramente 
magnetostática  desde  el  punto  de  vista  del  experimentador  en  el  laboratorio,  pero  puramente 
electrostática  en  el  sistema  de  referencia  de  los  electrones,  aunque  ambas  fuerzas  están  descritas 
por  la  misma  fuerza  de  Lorentz.  La  misma  expresión  (3.35)  es  por  lo  tanto  válida  en  todos  los 
sistemas  inerciales,  independientemente  del  estado  de  movimiento  de  la  partícula  en  cuestión. 

Incluso  se  puede  hacer  este  análisis  de  manera  cuantitativa,  aunque  nos  limitaremos  a calcular 
la  fuerza  actuando  sobre  un  solo  electrón  en  un  conductor  por  los  campos  eléctricos  y magnéticos 
del  otro  conductor  en  el  caso  de  las  corrientes  paralelas.  Dejaremos  el  otro  caso  como  ejercicio 
para  el  estudiante  interesado. 


Como  hemos  dicho,  el  campo  magnético  de  un  conductor  lineal  por  la  que  pasa  una  corriente 
/ = ~p{)V  Rq  ez,  con  R0  el  radio  del  conductor,  viene  dado  por  (1.32), 


B = 


PqvRq  _ 
2cr 


(3.48) 


nidense  Benjamín  Franklin  (1706  - 1790)  de  identificar  la  corriente  eléctrica  como  el  movimiento  de  cargas  positivas.  El 
descubrimiento  del  electrón  en  1897  por  el  físico  inglés  Joseph  John  Thomsom  (1856  - 1940)  aclaró  el  asunto,  pero  ya 
era  tarde  para  cambiar  una  notación  generalmente  aceptada,  de  modo  que  sigue  el  convenio  que  I = —p-vA,  con  A la 
superficie  seccional  del  conductor. 

8Nótese  que  esto  es  un  caso  especial  de  la  fórmula  (3.37),  donde  (j+)x  = 0 en  el  sistema  de  laboratorio. 
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Figura  3.4:  Las  fuerzas  electrostáticas  y magnetostáticas  entre  dos  conductores  paralelos  vistos  desde  dos 
sistemas  de  referencia  distintas:  En  el  sistema  del  laboratorio  (arriba)  la  densidad  de  cargas  positivas  (círcu- 
los negros)  es  igual  (pero  opuesta)  a la  densidad  de  cargas  negativas  (círculos  blancos)  y la  única  fuerza 
que  experimentan  los  electrones  es  magnetostática,  debido  a que  se  mueven  en  el  campo  magnético  del  otro 
conductor.  La  fuerza  es  atractiva  si  las  corrientes  son  paralelas  (izquierda)  y repulsiva  si  son  antiparalelas 
(derecha).  En  el  sistema  de  referencia  de  los  electrones  (abajo),  debido  a la  contracción  de  Lorentz,  el  otro 
conductor  tiene  una  densidad  de  carga  neta  positiva  si  las  dos  corrientes  son  paralelas  (izquierda)  y ne- 
gativa si  son  antiparalelas  (derecha),  lo  que  resulta  en  unas  fuerzas  electrostática  atractivas  y repidsivas 
respectivamente. 


y por  lo  tanto  un  electrón  que  se  mueve  en  el  sistema  del  laboratorio  con  una  velocidad  v = -vez 
antiparalela  a la  corriente  / (es  decir,  forma  parte  de  una  corriente  que  va  en  el  mismo  sentido 
que  /),  experimenta  una  fuerza  de  Lorentz 


F = -e 


v x B —epoirR¿ 
c 2 c2r 


(3.49) 


Por  otro  lado,  en  el  sistema  de  referencia  del  electrón,  un  conductor  lineal  con  densidad  de 
carga  p'tot  crea  un  campo  eléctrico  (ejerc.) 


É = 


(3.50) 


por  lo  que  el  electrón  experimenta  una  fuerza  de  Lorentz 


F' 


-eÉ  = 


1 -ep0v2R% 
y/l  -v2/c2  2c2r  6r 


(3.51) 


donde  hemos  usado  la  fórmula  (3.46)  que  relaciona  la  densidad  p'tot  con  po . Vemos  por  lo  tanto 
que  las  expresiones  para  la  fuerza  de  Lorentz  en  ambos  sistemas  de  referencia  están  relacionadas 
como 


Z71'  Z7> 

y/l  ~V2/C2 


(3.52) 


Esta  relación  obviamente  no  es  casualidad:  esta  fórmula  claramente  es  un  caso  especial  de  una 
transformación  de  Lorentz  entre  la  fuerza  y otra  cantidad,  que  en  este  caso  es  cero  en  el  sistema 
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del  laboratorio.  Efectivamente,  en  el  Capítulo  5 veremos  que  la  fuerza  y el  trabajo  W ejercido  por 
esa  fuerza  por  unidad  de  tiempo  transforman  bajo  una  transformación  de  Lorentz  como 


W - vFx/c2  pl  _ Fx  — vW 

y/ 1~V2/C 2 ’ * y/l-V2 /C2' 


(3.53) 


En  particular,  como  la  fuerza  de  Lorentz  en  el  sistema  de  laboratorio  es  puramente  magnetostáti- 
ca,  el  trabajo  ejercido  por  ella  es  cero  en  este  sistema  de  referencia. 


3.5.  El  espacio  de  Minkowski 

Despúes  de  haber  estudiado  las  reglas  de  transformación  de  diversas  cantidades  físicas,  tanto 
cinemáticas  como  electrodinámicas,  nos  debería  la  llamar  la  atención  que  ciertas  combinaciones 
matemáticas  aparecen  en  varias  ocasiones.  En  realidad  esto  nos  indica  la  existencia  de  una  estruc- 
tura matemática  subyacente,  que  nos  permitirá  no  sólo  simplificar  las  ecuaciones,  sino  también 
nos  enseñara  una  importante  lección  sobre  la  estructura  del  espaciotiempo.  Estudiaremos  en  mu- 
cho detalle  esta  estructura  matemática  en  el  Capítulo  5,  pero  queremos  terminar  este  capítulo  con 
un  pequeño  adelanto. 

Hemos  visto  en  la  sección  3.2  que  una  condición  clave  en  la  derivación  de  las  transformaciones 
de  Lorentz  era  el  hecho  de  que  éstas  dejan  la  cantidad 

s2  = c2t2  - x2  - y2  - z2  (3.54) 

invariante  (véase  por  ejemplo  (3.17)).  En  otras  palabras,  s2  tiene  el  mismo  valor  para  todos  los 
observadores  relacionados  a través  de  una  transformación  de  Lorentz.  Por  la  forma  del  invariante 
s2 , podemos  distinguir  3 casos:  dependiendo  de  los  valores  de  las  coordenadas,  s2  puede  ser 
mayor,  menor  o igual  a cero. 

Podemos  representar  todos  los  eventos  en  el  espacio  de  Minkowski,  un  espacio  de  sucesos,  don- 
de cada  suceso  está  caracterizado  por  su  posición  x,y,  z y el  momento  t en  que  ocurre.  En  este 
espacio  de  sucesos,  la  ecuación  s2  = 0 es  la  trayectoria  de  una  señal  de  luz  esférica  emitida  des- 
de el  origen  en  el  instante  t = 0:  en  cada  momento  la  señal  consiste  en  una  esfera  de  radio  ct. 
Si  dibujamos  las  coordenadas  x(t),  y(t),  z(t)  como  función  del  tiempo,  vemos  que  la  trayectoria 
corresponde  a un  cono  invertido  con  el  vértice  en  el  origen  ct  = x = y = z = 0 (véase  Figura  3.5). 
De  igual  modo  la  trayectoria  de  toda  la  luz  que  llega  en  el  momento  t = 0 al  punto  x = y = z = 0 
es  otro  cono  con  el  vértice  en  el  origen.  A estos  dos  conos  se  les  llama  el  cono  de  luz  futuro  (zona  I 
en  Figura  3.5)  y el  cono  de  luz  pasado  (zona  II  en  Figura  3.5)  respectivamente. 

La  trayectoria  de  un  observador  O en  el  origen  de  su  sistema  de  referencia,  que  utiliza  las 
coordenadas  (ct,  x,y,  z)  es  x = y = z = 0,  es  decir  el  eje  ct,  dado  que  está  en  reposo  con  respecto  a 
sí  mismo.  La  trayectoria  de  un  observador  O'  que  se  mueve  con  velocidad  constante  con  respecto 
a O y que  coincide  con  O en  el  momento  t = 0,  es  una  recta  que  pasa  por  el  origen  (véase  Figura 
3.5).  Debido  a que  la  velocidad  de  O'  siempre  es  menor  que  c,  su  trayectoria  cae  dentro  del  cono 
de  luz.  En  general,  debido  a que  c es  la  velocidad  máxima  permitida,  cualquier  partícula  que  pase 
por  el  origen  siempre  se  quedará  dentro  del  cono  de  luz. 

Los  puntos  dentro  del  cono  de  luz  satisfacen  la  condición  s2  > 0,  mientras  que  los  puntos 
fuera  del  cono  de  luz  (la  zona  III  en  Figura  3.5)  satisfacen  la  condición  s2  < 0.  Cualquier  punto 
dentro  del  cono  de  luz  está  en  contacto  causal  con  el  punto  ct  = x = y = z = 0,  puesto  que  es 
posible  mandar  una  señal  desde  un  punto  dentro  del  cono  pasado  al  origen,  o desde  el  origen 
a un  punto  dentro  del  cono  futuro.  Sin  embargo  los  puntos  fuera  del  cono  de  luz  no  están  en 
contacto  causal  con  el  origen:  ninguna  señal  de  luz  llegaría  desde  el  origen  a un  punto  en  la 
zona  III  o vice  versa.  Esta  estructura  causal  es  igual  para  todos  los  observadores,  dado  que  las 
transformaciones  de  Lorentz  dejan  la  cantidad  s 2 invariante. 
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Figura  3.5:  Los  conos  de  luz  en  el  espacio  de  Minkowski:  los  conos  representan  la  trayectoria  de  los  rayos 
de  luz  que  pasan  por  el  punto  x = y = z = Oenel  momento  t = 0.  El  interior  de  los  conos  de  luz  (las  zonas 
I y II)  representan  posibles  trayectorias  de  observadores  inerciales  que  se  mueven  con  velocidad  constante 
pasando  por  el  origen  (linea  discontinua).  El  exterior  de  los  conos  (la  zona  III)  no  está  en  conexión  causal 
con  el  origen. 


Matemáticamente  el  espacio  de  Minkowski  tiene  la  esctructura  de  un  espacio  vectorial,  de 
modo  que  podemos  pensar  en  las  coordenadas  ( ct , x,  y,  z)  de  un  suceso  como  un  vector  cuadi- 
mensional  x en  este  espacio  vectorial  y en  la  cantidad  s2  como  el  cuadrado  de  la  norma  del  vector. 
Fíjese  que  para  esto  hemos  tenido  que  introducir  una  nueva  definición  para  el  producto  escalar 
entre  dos  vectores  á y b en  el  espacio  de  Minkowski  como 

á-b  = atbt  - axbx  - ayby  - azbz.  (3.55) 

Esta  definición  proporciona  un  producto  escalar  y una  norma  que  no  es  definida  positiva.  El 
espacio  de  Minkowski  por  lo  tanto  no  tiene  una  geometría  euclídea,  sino  lo  que  se  llama  pseudo- 
euclídea  o lorentziana.  Volveremos  a esto  en  más  detalle  en  el  Capítulo  5. 

Por  lo  tanto  la  cantidad  s 2 = c2t2  - x2  - y1  - 2 2 representa  el  cuadrado  de  la  distancia  entre 
un  suceso  (ct,  x,  y,  z)  y el  origen.  En  general,  la  cantidad 

As2  = c(t2  - h)2  - (x2  - xx)2  - (y2  - yi)2  - (z2  - zx)2  (3.56) 

es  el  cuadrado  de  la  distancia  entre  dos  sucesos  (ct\,x\,y\,z\)  y (ct2,x2,y2,  z2)  en  el  espacio 
de  Minkowski.  Si  la  distancia  As2  > 0,  los  sucesos  están  separados  por  un  intervalo  temporal, 
si  la  distancia  As2  = 0 por  un  intervalo  nulo  o tipo  luz  y si  la  distancia  As2  < 0 por  un  intervalo 
espacial.  Como  hemos  visto  antes,  sólo  hay  conexión  causal  entre  sucesos  separados  por  intervalos 
temporales  o nulos. 

Una  transformación  de  Lorentz  (3.19)  relaciona  las  componentes  (ct,  x,  y,  z ) de  un  vector  de 
posición  visto  por  un  observador  O con  las  componentes  (ct1 , x' , y' , z')  del  mismo  vector  visto 
por  otro  observador  O' . Una  transformación  de  Lorentz  entonces  no  es  más  que  un  cambio  de 
base  dentro  del  espacio  de  Minkowski.  Ya  hemos  visto  que  la  trayectoria  de  O'  es  una  recta  por  el 
origen  dentro  del  cono  de  luz,  donde  el  ángulo  [3  entre  la  trayectoria  y el  eje  ct  es  una  medida  de 
la  velocidad  de  O':  tg/3  = v/c  (véase  Figura  3.6).  El  observador  O'  tomará  esta  recta  como  su  eje 
tempotal  ct',  puesto  que  está  en  resposo  con  respecto  a sí  mismo.  Dado  que  para  O'  la  velocidad 
de  la  luz  tiene  que  ser  igual  que  para  O,  el  eje  x1  de  O'  está  orientado  de  manera  simétrica  con 
respecto  al  cono  de  luz,  es  decir  el  ángulo  entre  el  eje  xy  x'  también  es  ¡3  (véase  Figura  3.6).  Tanto 
el  sistema  de  referencia  ( ct,x,y,z ) de  O como  el  sistema  (ct1  ,x'  ,y' , z')  de  O'  forman  una  base 


57 


Figura  3.6:  Una  transformación  de  Lorentz  en  el  espacio  de  Minkowski:  el  mismo  suceso  tiene  coordenadas 
( ct , x ) para  el  observador  O y coordenadas  ( ct x')  para  el  observador  O'.  Los  dos  sistemas  de  referencia 
están  relacionados  a través  de  una  transformación  de  Lorentz  (3.19). 


completa  del  espacio  de  Minkowski,  y la  diferencia  entre  ellos  es  un  cambio  de  base  a través  de 
la  transformación  (3. 19). 9 

Con  los  diagramas  de  espacio-tiempo  descritos  arriba  podemos  fácilmente  derivar  efectos 
como  la  contracción  de  Lorentz  y la  no-simultaneidad  de  eventos.  Una  varilla  de  longitud  L' 
(medida  en  coordenadas  x')  que  se  mueve  junto  con  el  observador  O',  barrerá  una  trayectoria 
como  la  dibujada  en  Figura  3.7.  Sin  embargo  para  O,  que  mide  a lo  largo  del  eje  x,  la  longitud 
de  la  varilla  será  L < L1,  debido  a la  contracción  de  Lorentz.  Para  O'  sucesos  simultáneos  son 
los  que  tienen  el  mismo  valor  para  ct',  como  los  puntos  a y b a los  dos  extremos  de  la  varilla 
según  O' . Para  O sucesos  simultáneos  tienen  el  mismo  valor  de  ct,  como  los  puntos  ay  c a los 
extremos  de  la  varilla  visto  por  O.  Para  O el  suceso  a ocurre  por  lo  tanto  antes  que  b,  mientras  que 
para  O'  c ocurre  antes  que  a.  En  el  diagrama  de  la  Figura  3.7  podemos  ver  que  para  cualesquiera 
dos  eventos  separados  por  un  intervalo  temporal  existe  un  observador  que  ve  estos  eventos  en  el 
mismo  lugar,  mientras  para  dos  eventos  separados  por  un  intervalo  espacial  existe  un  observador 
que  los  ve  simultáneos  (ejerc.). 

Hemos  visto  que  la  posición  (ct,  x,  y,  z)  de  un  evento  es  un  vector  en  el  espacio  de  Minkows- 
ki y la  transformación  de  Lorentz  (3.19),  un  cambio  de  base.  Pero  t y x no  son  las  únicas  can- 
tidades físicas  que  están  relacionadas  a través  de  una  transformación  de  Lorentz.  La  ecuación 
(3.31)  dice  que  también  la  energía  E y el  momento  p definido  en  (3.25)  transforman  unos  en 
otros.  En  otras  palabras,  E y p también  forman  las  componentes  de  un  vector  cuadrimensional 
p = ( E/c,px,py,pz ) en  el  espacio  de  Minkowski  y transforman  como  (3.31)  bajo  el  cambio  de 
base  (3.19).  La  relación  (3.32)  entonces  es  precisamente  el  cuadrado  de  la  norma  del  vector  de 
energía-momento  p ■ p = rnfc2,  según  la  definición  (3.55)  del  producto  escalar.  El  hecho  de  que 
E2  — p2c2  tenga  el  mismo  valor  para  todos  los  observadores  es  justo  porque  es  la  norma  de  un 
vector  cuadrimensional,  y por  lo  tanto  es,  a igual  que  s2,  un  invariante  Lorentz. 

También  en  electromagnetismo  hemos  encontrado  varias  cantidades  que  transforman  bajo 
transformaciones  de  Lorentz  y que  por  lo  tanto  forman  vectores  cuadrimensionales:  la  carga  y la 
corriente  son  componentes  del  vector  j = ( cp,jx,jy,jz ) y de  igual  manera  <j>  y A combinan  para 
formar  el  vector  A = (é.  Ax,  Ay,Az).  El  caso  de  los  campos  electromagnéticos  E y B es  un  poco 
más  sutil,  puesto  que  las  transformaciones  (3.38)  son  más  complicadas  que  las  transformaciones 

9Obsérvese  que,  al  constrario  de  lo  que  podría  sugerir  la  Figura  3.6,  tanto  el  sistema  (ct,  x,  y,  z)  de  O como  el  sistema 
(ct1  ,x'  ,y' , z')  de  O'  forman  bases  ortogonales  según  la  definición  (3.55)  (ejerc.). 


58 


Figura  3.7:  La  contracción  de  Lorentz  y la  no-simultaneidad  de  eventos  en  el  espacio  de  Minkowski.  Una 
varilla  de  longitud  L'  para  un  observador  en  resposo  con  respecto  a la  varilla,  tiene  una  longitud  L < L' 
para  un  observador  que  ve  la  varilla  moverse.  Los  eventos  que  un  observador  llama  simultáneos  no  lo  son 
para  otro. 


de  Lorentz  que  hemos  visto  en  otros  casos.  Resulta  que  É y B no  son  las  componentes  espaciales 
de  dos  vectores  cuadrimensionales,  sino  que  combinan  en  un  tensor  antisimétrico 
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BX 

0 

(3.57) 


Hemos  visto  por  lo  tanto  que  toda  la  dinámica  relativista,  tanto  la  mecánica  como  el  electro- 
magnetismo, se  puede  formular  en  función  de  vectores  y tensores  cuadrimensionales  que  trans- 
forman de  determinada  manera  bajo  las  transformaciones  de  Lorentz.  Esto  es  necesario  para  que 
se  cumpla  el  Principio  de  la  Relatividad,  es  decir  que  las  leyes  de  la  física  tengan  la  misma  forma 
para  todos  los  observadores  en  movimiento  uniforme  y rectilíneo  relativo. 

En  el  Capítulo  5 volveremos  a introducir  estos  conceptos  de  manera  más  formal,  que  tie- 
ne la  ventaja  de  ser  directamente  generalizable  a transformaciones  que  relacionan  observadores 
en  movimiento  no  necesariamente  uniforme  y rectilíneo.  Pero  primero  repasaremos  un  poco  de 
álgebra  lineal,  necesario  para  entender  bien  este  formalismo. 
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Capítulo  4 


Álgebra  de  tensores  y 
transformaciones  ortogonales 


La  educación  matemática  del  joven  físico  [Albert  Einstein]  no  era  muy  sólida,  y yo 
estoy  en  una  buena  posición  para  evaluarla,  puesto  que  la  ha  recibido  de  mi  en  Zürich 
hace  tiempo. 

(H.  Minkowski) 


En  este  capítulo  repasaremos  las  propiedades  básicas  de  álgebra  lineal  y transformaciones 
ortogonales,  ya  que  la  formulación  covariante  de  la  relatividad  especial  recurre  a las  mismas 
técnicas. 


4.1.  El  convenio  de  sumación  de  Einstein 


A partir  de  este  capítulo  utilizaremos  el  llamado  convenio  de  sumación  de  Einstein,  una  manera 
compacta  de  anotar  formulas,  introducida  por  Einstein  en  1916.  En  cuanto  un  índice  aparezca 
repetido  arriba  y abajo,  se  supone  una  suma  sobre  todos  los  posibles  valores  de  este  índice,  su- 
primiendo un  signo  de  sumatorio  explícito.  Los  índices  repetidos  también  se  llaman  mudos.  La 
descomposición  de  un  vector  |a)  en  una  base  {|e¿}}  sería  por  lo  tanto  | a)  = al\ej)  y un  producto 
escalar  entre  dos  vectores  (a\b)  = ciib1,  donde  la  suma  en  ambos  casos  contiene  A términos  en  un 
espacio  vectorial  A-dimensional.  Del  mismo  modo  el  producto  de  dos  matrices  C = AB  se  anota 
entonces  como  Clj  = AlkBkj. 

Dado  que  un  índice  repetido  sólo  es  un  índice  de  sumación,  da  igual  el  nombre  que  le  demos, 
de  modo  que  tenemos  que  a¿6*  = akbk  } Además,  como  dentro  de  cada  término  de  la  suma,  los 
factores  son  simplemente  números  reales  o complejos,  el  orden  de  los  factores  no  influye,  siempre 
y cuando  respectamos  el  lugar  de  los  índices:  Cl j = AlkBkj  = BkjAlk,  pero  AlkBkj  f B\Akj. 

Los  índices  que  no  están  sumados  se  llaman  libres.  En  una  ecuación  vectorial  o tensorial,  los 
indices  libres  en  cada  lado  de  la  igualdad  tienen  que  ser  los  mismos.  En  convenio  de  sumación 
de  Einstein  también  supone  A ecuaciones  para  cada  índice  libre  (una  para  cada  valor  del  índice). 

'Siempre  y cuando  no  se  repite  el  nombre  de  índices  contraidos:  no  es  posible  saber  si  la  expresión  errónea  a¿í>ic*d' 
se  refiere  a (a\c)(b\d)  = aibjC^óP  o a (a\d)(b\c)  = aibjC^ dl . 
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Figura  4.1:  La  descomposición  de  los  vectores  de  base  \ e/)  en  la  base  {|e¿)}.  Las  componentes  ( M 1)lj 
forman  una  matriz  N x N que  parametriza  el  cambio  de  base. 


4.2.  Espacios  vectoriales  y duales 


Consideramos  el  espacio  vectorial  A-dimensional  M'v,  con  un  origen  O y una  base  { |e¿) }, 
formado  por  N vectores  linealmente  independientes.  A cada  punto  x de  se  le  asigna  un 
vector  de  posición  \x),  que  se  descompone  en  la  base  { |e¿) } como 

\x)  = x1^)  + x2\e2)  + ■■■  + xN\eN)  = xl\ e¿).  (4.1) 


(Nótese  que  estamos  utilizando  el  convenio  de  sumatoria.)  La  descomposición  \x)  en  la  base 
{|e,)}  es  única  y los  números  xl  son  las  componentes  de  |x)  en  la  base  { | e¿) }.  Otra  manera  de  repre- 
sentar el  vector  |x)  es  a través  de  sus  componentes,  como  un  vector  de  columna 


/ ^ \ 


J 


(4.2) 


En  vez  de  trabajar  en  la  base  {| e¿)},  podríamos  haber  escrito  \x)  en  una  base  distinta  { \ef) }, 
donde  la  descomposición  sería 

I*)  = x'fei').  (4.3) 

Para  encontrar  la  relación  entre  las  dos  bases,  descomponemos  los  vectores  de  base  |e¿')  en  la 
base  { | e¿) } (véase  Figura  4.1), 

\ej)  = (M-'Tj  \ei),  (4.4) 

donde  (M_1)*j  es  la  componente  i del  vector  \e/)  en  la  base  {| e¿)}.2  Desde  el  punto  de  vista 
matemático  M~l  es  la  matriz  N x N que  parametriza  la  transformación  entre  las  dos  bases. 


Dado  que  el  vector  \x)  en  (4.1)  y (4.3)  es  el  mismo  y que  la  relación  entre  las  dos  bases  viene 
dada  por  (4.4),  tiene  que  haber  una  relación  entre  las  componentes  xl  y . No  es  difícil  ver  que 
las  componentes  transforman  como 

xH  = Mij  x\  (4.5) 

donde  la  matriz  M es  la  inversa  de  M_1, 

M^M-1)^  = 5\  = (M-'YjMh,  (4.6) 

donde  Slj  son  las  componentes  de  la  matriz  identidad  11 


(iy 


0 cuando  i ^ j, 

1 cuando  i = j. 


(4.7) 


2Aquí  estamos  suponiendo  por  simplicidad  que  las  dos  bases  tienen  el  mismo  origen.  Si  no  es  así,  la  transformación 
es  de  la  forma  | ef)  = ( |e¿)  + |a). 
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Más  que  elementos  de  un  espacio  vectorial,  para  un  físico  un  vector  es  un  objeto  con  ciertas 
reglas  de  transformación.  Por  eso,  en  la  física  se  suele  tomar  la  regla  de  transformación  como 
la  definición  de  un  vector:  Cualquier  objeto  con  N componentes  xl  que  bajo  un  cambio  de  base 
(4.4)  transforma  como  (4.5)  se  le  llama  un  vector  de  columna  o un  vector  contravariante.  (Hemos 
añadido  los  adjetivos  "de  columna"  y "contravariante"  para  distinguirlo  de  otro  tipo  de  vector 
que  introduciremos  en  seguida.) 

El  hecho  de  que  en  la  transformación  de  los  vectores  de  base  (4.4)  aparezca  la  matriz  M_1, 
mientras  en  la  transformación  de  las  componentes  del  vector  aparezca  la  inversa  M,  puede  ser  un 
poco  confuso,  pero  tiene  que  ver  con  diferencia  entre  una  transformación  activa  y una  pasiva.  No 
entraremos  en  detalles  aquí,  puesto  que  no  nos  hace  falta.  En  realidad  toda  la  información  física 
de  un  vector  está  contenida  en  sus  componentes,  de  modo  que  dadas  las  componentes  de  un 
vector  en  una  base  y sabiendo  la  regla  (4.5)  de  transformación  a otra  base,  podemos  trabajar  sólo 
con  las  componentes,  sin  tener  que  hacer  referencia  a los  vectores  de  base  o las  transformaciones 
de  estos  últimos.  Esto  es  lo  que  haremos  en  este  curso,  salvo  en  esta  sección  y la  siguiente,  por 
razones  pedagógicas. 

Considera  ahora  el  espacio  de  las  aplicaciones  lineales  (y  \ que  llevan  los  vectores  de  R'V  a los 
números  reales  R:  la  aplicación  (y  | actúa  sobre  el  vector  contra  variante  \x)  como  (y\x)  £ R.  Dado 
que  estas  aplicaciones  son  lineales  (por  construcción)  tenemos  que 

(y\ (u\xi)  + /3|£2))  = Oi{y\x-i)  + (3(y\x2).  (4.8) 

Además  una  combinación  lineal  de  dos  de  estas  aplicaciones,  también  es  una  aplicación 

(&{yi\  +/%2|)|z)  = Oí{yx\x)  +/3{y2\x),  (4.9) 

de  modo  que  el  espacio  de  las  aplicaciones  lineales  también  tiene  la  estructura  matemático  de 
un  espacio  vectorial,  usualmente  llamado  el  espacio  dual  *M.N . Por  lo  tanto  podemos  considerar 
también  los  (y  \ como  un  tipo  de  vectores  (aunque  distinto  de  los  \x) , como  veremos  en  seguida) 
y construir  una  base  dual  { (e*  | },  en  el  cual  las  aplicaciones  lineas  se  descomponen  como 

(y\  = 2/i  (e1 1 + 2/2  (e2 1 + + Vn(cn\  = y¿(e*|.  (4.10) 

Dado  la  estructura  de  espacio  vectorial  dual,  es  habitual  llamar  a los  (y \ vectores  covariantes,  o 
nno-formas.  Una  manera  alternativa  de  representar  los  vectores  covariantes  es  por  lo  tanto  como 
vector  de  fila: 

( 2/1,  3/2,  --- , 3/jv)  (4.11) 

Obsérvese  que  anotamos  las  componentes  de  los  vectores  contravariantes  (es  decir  elementos  de 
Rw)  con  índice  arriba,  mientras  las  componentes  de  los  vectores  covariantes  (los  elementos  del 
espacio  dual)  con  índice  abajo. 

Los  vectores  covariantes  actúan  sobre  los  contravariantes  mediante  el  producto  escalar.  Lo  más 
sencillo  es  definir  el  producto  escalar  utilizando  los  vectores  de  base:  por  definición  el  producto 
escalar  entre  el  vector  de  base  dual  (e'  | y el  vector  de  base  \ek)  es 

<eí  ei)  = (4.12) 

donde  S f es  la  delta  de  Kronecker 


í 0 cuando  i f j, 
\ 1 cuando  i = j. 


(4.13) 


Utilizando  las  propiedades  de  linealidad  (4.8)  y (4.9),  es  obvio  que  en  general  el  producto  escalar 
entre  un  vector  covariante  (y  \ y un  vector  contravariante  \x)  viene  dado  por 

(y\x)  = yixk{éí\ek)  = yixkb\  = (4.14) 
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lo  que  efectivamente  es  un  elemento  de  R. 

Lo  que  nos  interesa  en  este  momento  es  saber  cómo  cambian  las  componentes  y,;  del  vector 
covariante  bajo  el  cambio  de  coordenadas  (4.4).  Dado  que  por  la  definición  del  producto  escalar 
(4.12)  las  componentes  y¡  en  la  base  {| e¿)}  vienen  dadas  por  y¡  = (y\eí),  tenemos  que  las  compo- 
nentes y\  en  la  base  {|e')|  toman  la  forma 

Vj  = ivWj)  = (y\(M~1)i  j\ei)  = (M~1yj(y\ei)  = (M~1)ijyi,  (4.15) 

o,  resumiendo 

y'j  = (M-yjVi.  (4.16) 

En  otras  palabras,  las  componentes  de  un  vector  covariante  tranforman  de  la  misma  manera  que 
los  vectores  de  base,  pero  de  manera  opuesta  a las  componentes  de  un  vector  contravariante.3 

También  aquí  podemos  tomar  esta  propiedad  como  la  definición  práctica  de  un  vector  co- 
variante: Cualquier  objeto  con  N componentes  que  bajo  un  cambio  de  base  (4.4)  transforma 
como  (4.16)  se  le  llama  un  vector  covariante.  Nótese  que,  debido  al  hecho  de  que  anotamos  el  vec- 
tor contravariante  xl  con  índice  arriba  y el  vector  covariante  x,  con  índice  abajo,  las  reglas  de 
transformación  son  (ligeramente)  diferentes  para  cada  caso. 

De  la  regla  de  transformación  de  los  vectores  covariantes  (4.16)  podemos  deducir  las  reglas 
de  transformación  de  los  vectores  de  la  base  dual.  Con  un  argumento  parecido  (pero  inverso)  que 
en  el  caso  de  los  vectores  contravariantes  vemos  que  la  relación  entre  los  vectores  de  la  base  dual 
viene  dada  por 

(e'i\=Mij{ej\.  (4.17) 

Una  consecuencia  directa  de  las  reglas  de  transformación  de  la  base  y la  base  dual  es  que  el 
producto  escalar  (4.12)  entre  vectores  de  base  se  conserva, 

{J%)  = Mík(M~1)lJ{ek \ei)  = Mik(M~1)ljSki  = Mik{M~1)kj  = ¿y  (4.18) 

Y gracias  a la  linealidad  del  producto  escalar,  también  se  conserva  el  producto  escalar  entre  dos 
vectores  (y  | y \x),  independientemente  de  la  base  en  que  se  calcula.  Efectivamente  en  componen- 
tes vemos  que 

{y\x)  = y[x'1  = yk  Mli  xl  = 6kiykxl  = ykxk . (4.19) 

Esto  es  lo  que  uno  esperaría,  puesto  que  el  producto  escalar  es  un  número  real,  cuyo  valor  no 
depende  de  la  elección  de  base. 


4.3.  La  métrica  y las  transformaciones  ortogonales 


En  la  sección  anterior  hemos  introducido  RjV  como  un  espacio  vectorial,  con  los  vectores 
contravariantes  como  elementos  y hemos  definido  el  espacio  dual  con  los  vectores  covariantes. 
Hemos  visto  cómo  transforma  cada  uno  bajo  cambios  de  base  y definido  un  producto  escalar 
entre  vectores  covariantes  y contravariantes  que  es  independiente  de  la  elección  de  base. 

Sin  embargo,  esta  estructura  todavía  es  bastante  pobre.  No  podemos  dar  una  interpretación 
(física)  al  producto  escalar,  aparte  de  una  aplicación  lineal  resultando  en  un  número  real.  Tam- 
poco podemos  calcular  la  norma  de  un  vector,  o el  ángulo  entre  dos  vectores  en  M.N . Para  saber 
por  ejemplo  si  una  base  { | e¿) } es  ortogonal  y normalizada,  tenemos  que  calcular  el  producto 
escalar  entre  dos  vectores  de  la  base  |e¿)  y | ej),  mientras  el  producto  escalar  (4.12)  y (4.14)  sólo 
está  definido  entre  un  vector  covariante  y uno  contravariante. 

3 De  hecho,  los  nombre  covariante  y contravariante  vienen  de  allí.  En  1853,  en  su  estudio  de  invariantes  algebráicas,  el 
matemático  inglés  James  Joseph  Sylvester  (1814  - 1897)  denominó  las  aplicaciones  lineales  y los  vectores  de  R-^  respec- 
tivamente vectores  covariantes  y contravariantes,  por  su  propiedad  de  transformar  junto  con  o en  dirección  opuesta  a la 
base. 
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Lo  que  necesitamos  claramente  es  una  estructura  matemática  nueva  que  nos  permita  relacio- 
nar un  vector  contravariante  \x)  unívocamente  con  su  correspondiente  vector  covariante  (x\ . Esto 
es  lo  que  va  hacer  la  métrica  y gracias  a ella  podremos  definir  normas,  ángulos  y distancias  en 

Rn. 

La  métrica  g.tj  se  puede  ver  como  una  operación  que,  actuando  sobre  un  vector  covariante,  da 
un  vector  contra  variante.  En  los  vectores  de  base  actúa  como 

\ei)=giJ(ei\.  (4.20) 

Inversamente  la  métrica  inversa  g'3  transforma  un  vector  covariante  en  uno  contravariante 

{é\=g^\ej).  (4.21) 

Nótese  que  la  unicidad  de  la  decomposición  de  vectores  en  una  base  implica  que  gij  y glj  están 
relacionados  a través  de  la  relación  gijg3k  = dk,  (ejerc.).  De  allí  que  glJ  se  llama  la  métrica  inversa. 

En  general  podemos  relacionar  las  componentes  del  vector  contra  variante  \x)  con  las  compo- 
nentes del  vector  covariante  [x\  a través  de  la  métrica  de  la  siguiente  manera:  en  la  base  { |e,) },  la 
decomposición  del  vector  \x)  es 

*%>  = |,  (4.22) 

donde  hemos  utilizado  la  relación  (4.21)  entre  las  dos  bases.  Ahora,  también  podemos  pensar  en 
el  lado  derecho  de  (4.22)  como  la  descomposición  de  ( x\  en  la  base  { (eL\ },  lo  que  implica  que  las 
componentes  Xi  de  (xj  se  pueden  escribir  en  función  de  las  xl  como 

Xi=gijXj.  (4.23) 

Con  un  argumento  similar  podemos  también  invertir  esta  relación,  escribiendo  las  componentes 
Xi  en  función  de  las  x‘  (ejerc.) 

xi  = gijXj.  (4.24) 

Por  lo  tanto  vemos  que  la  métrica  y la  inversa  " suben  y bajan  Índices",  convirtiendo  vectores  co- 
variantes en  contravariantes  y vice  versa.  Una  vez  introducida  la  métrica,  se  puede  por  lo  tanto 
pensar  en  los  vectores  covariantes  como  un  "truco  matemático"  para  poder  definir  bien  el  pro- 
ducto escalar  entre  dos  vectores  contravariantes,  puesto  en  el  fondo  (4.23)  y (4.24)  están  diciendo 
que  un  vector  contravariante  y su  correspondiente  vector  covariante  tienen  la  misma  información 
física. 

Para  que  las  relaciones  (4.23)-(4.24)  sean  consistentes  con  las  reglas  de  transformación  (4.5)  y 
(4.16)  de  los  vectores  covariantes  y contravariantes  (o,  equivalentemente,  para  que  (4.21)  y (4.20) 
sean  consistentes  con  las  reglas  de  transformación  de  los  vectores  de  base),  la  métrica  y su  inversa 
tienen  que  transformar  bajo  un  cambio  de  coordenadas  M como 

g'j  = (M-y^M-1)^,  g'i3  = A'PkMri  gkl,  (4.25) 

donde  gb  y </'ÍJ  son  la  métrica  y su  inversa  en  las  bases  ||e')}  y {(e'*|}.  En  general  un  cambio  de 
coordenadas  M puede  hacer  que  la  forma  explícita  de  gri  sea  muy  diferente  que  la  forma  de  g,:i . 
Sin  embargo  no  hay  que  olvidar  que  las  dos  expresiones  representan  la  misma  métrica,  la  de  RN , 
sólo  en  diferentes  coordenadas.  En  la  sección  4.4  veremos  un  ejemplo  concreto. 

La  introducción  de  la  métrica  permite  ampliar  la  definición  del  producto  escalar  (4.14),  tal  que 
también  incluye  el  producto  escalar  entre  dos  vectores  contravariantes.  Utilizando  la  definición 
(4.21),  tenemos  que 

\x)-\y)  = xlykgij(eJ\ek)  = gijXlyk50k  = gijXly 3 = xry3 . (4.26) 

Con  este  producto  escalar  podemos  entonces  definir  la  norma  ||  |:e)  |¡  de  un  vector  \x)  como 

|||a;)||2  = (ir|a;}  = XiX 1 = gijXlx\  (4.27) 
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Finalmente  el  ángulo  9 entre  dos  vectores  \x)  y | y)  se  define  como 


eos  9 = 


(x\ y) 

l*)i  ¡\y)f 


(4.28) 


de  modo  que  dos  vectores  son  ortogonales  cuando  el  producto  escalar  es  cero.  Dejamos  como 
ejercicio  demostrar  que  las  reglas  de  transformación  son  tales  que  (4.26),  (4.27)  y (4.28)  tienen  el 
mismo  valor  en  todos  las  bases. 


Con  estas  definiciones  podemos  construir  una  base  ortonormal  en  IR N . Decimos  que  la  base 
{ I e'¿ ) } es  ortogonal  y normalizada  si 

I ei)-\ej)=Sij,  (4.29) 

donde  Sij  es  la  métrica  de  IR N en  coordenadas  cartesianas,  a veces  llamada  por  simplicidad  (aun- 
que no  del  todo  correcto)  la  métrica  euclidea ,4 


( 1 

0 . 

..  0 \ 

0 

1 .. 

• o 

l 0 

0 . 

(4.30) 


La  definición  (4.29)  es  consistente  con  (4.21),  puesto  que 


|e¿)  • \ej)  = 5ik(ek\ej)  = 5ik  5k j = <%. 


(4.31) 


La  gran  ventaja  de  utilizar  una  base  ortonormal  en  IR N es  que  la  forma  (4.30)  de  la  métrica  es 
extremadamente  simple.  También  está  claro  que  la  expresión  explícita  de  las  componentes  de  un 
vector  covariante  son  idénticas  a las  componentes  del  vector  contravariante  correspondiente. 


xi  =6ijXj, 


X'¡  — Sij  xP , 


(4.32) 


una  cosa  que  en  una  base  general  (y  por  lo  tanto  con  una  métrica  general  gij ) no  necesariamente  es 
el  caso,  como  demuestra  (4.23)-(4.24).  De  igual  manera,  en  una  base  ortonormal,  las  expresiones 
para  el  producto  escalar  y la  norma  toman  una  forma  más  sencilla: 

(x\y)  = Xiy1  = 6ijXlyJ , 

|||a:)||2  = XiX1  = 5íjXlx\  (4.33) 


Valoraremos  tanto  la  forma  sencilla  de  la  métrica  en  coordenadas  cartesianas,  que  nos  limita- 
remos para  el  resto  de  capítulo  a trabajar  exclusivamente  con  bases  ortonormales.  Sin  embargo 
es  útil  enfatizar  que  todas  las  propiedades  demostradas  en  en  resto  del  capítulo  siguen  siendo 
verdad  en  bases  arbitrarias,  cambiando  St:¡  por  yi:¡ . 

La  norma  (4.27)  nos  permite  introducir  el  concepto  de  distancia  en  WLN , ya  que  la  distancia  en- 
tre dos  puntos  x y y es  la  norma  del  vector  | x — y)  = \x)  — \y).  Está  claro  entonces  que  la  expresión 
(4.33)  para  la  norma  no  es  más  que  la  generalización  a N dimensiones  del  Teorema  de  Pytha- 
goras.  En  general  la  métrica  resume  las  propiedades  geométricas  del  espacio.  Concretamente  en 
este  caso,  (4.30)  nos  está  diciendo  que  la  geometría  de  es  la  geometría  plana  de  Euclides.  Por 
futuro  convenio  introducimos  el  elemento  de  línea  ds,  la  distancia  entre  un  punto  x y un  punto 
cercano  x + dx.  Para  el  caso  de  RjY  tenemos  en  coordenadas  cartesianas  que 

ds 2 = Sijdxldx- i = (dx1)2  + (dx2)2  + ...  + (dxN)2.  (4.34) 

4Ojo,  no  se  puede  confundir  la  métrica  euclidea  Sij  con  la  matriz  identidad  Sl  j . La  métrica  es  un  objeto  (un  tensor)  que 
describe  las  propiedades  geométricas  del  espacio,  mientras  la  matriz  identidad  es  la  transformación  trivial,  la  unidad.  La 
diferencia  se  hará  más  claro  en  la  siguiente  sección. 
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En  general  un  cambio  de  coordenadas  M no  transforma  una  base  ortonormal  en  otra  ortonor- 
mal,  de  modo  que  en  general  la  métrica  no  preserva  la  forma  (4.30)  bajo  un  cambio  de  base  M. 
Sin  embargo  sí  existe  un  clase  de  transformaciones  que  tienen  la  propiedad  que  dejan  la  forma 
de  la  métrica  invariante.  Consideremos  la  clase  de  matrices  M que  tienen  la  propiedad  que 

Su  = Mlk  Sij.  (4.35) 

Si  (|e¿)}  es  una  base  ortonormal  (es  decir,  la  métrica  toma  la  forma  S¡:i),  entonces,  utilizando  (4.25) 
es  fácil  de  ver  que  la  forma  de  la  métrica  en  la  nueva  base  es 

g'ij  = (M~1)ki  M\  Su  = Sij.  (4.36) 

En  otras  palabras,  en  la  nueva  base  la  métrica  también  es  de  la  forma  (4.30),  puesto  que  las  trans- 
formaciones consideradas  dejan  su  forma  invariante: 

Su  = (M~1)ki(M~1)ljSki.  (4.37) 

Las  transformaciones  que  satisfacen  la  condición  (4.35)  se  llaman  transformaciones  ortogonales.  Tie- 
nen la  buena  propiedad  de  que  transforman  una  base  ortonormal  en  otra  base  ortonormal  (esto 
es  la  razón  porque  deja  la  métrica  invariante). 

Hay  algunas  propiedades  más  de  las  matrices  ortogonales  que  merecen  la  pena  mencionar.  Si 
multiplicamos  ambos  lados  de  la  condición  (4.35)  condición  de  ortogonalidad  con  Slk,  tenemos 
que 

(M~1)ij  = SikMlkStj.  (4.38) 

La  combinación  de  métricas  contraida  de  esta  manera  con  Mlj  se  conoce  como  la  transpuesta  M1 
de  la  matriz  AI, 

(MT)ij  = SikMlk5lj.  (4.39) 

En  otras  palabras,  la  misma  definición  de  las  transformaciones  ortogonales  nos  está  diciendo  que 
la  inversa  de  la  matriz  ortogonal  M es  su  transpuesta  (en  forma  matricial  \ír  = AI-1).  Además 
las  matrices  ortogonales  M son  reales  y tienen  determinante  ±1.  Esta  última  propiedad  se  saca 
directamente  de  (4.38),  ya  que  si  A IT  = AI _1,  tomando  el  determinante  vemos  que  \M\  = |M|-1, 
o en  otras  palabras,  \M\  = ±1. 

Desde  en  punto  de  vista  geométrico,  las  transformaciones  ortogonales  son  las  rotaciones  (si 
tienen  determinante  1)  y las  reflexiones  (si  tienen  determinante  —1).  Las  transformaciones  orto- 
gonales en  N dimensiones  forman  el  grupo  O(N),  que  contiene  el  grupo  de  las  rotaciones  SO(N) 
como  subgrupo. 

Para  ser  consistentes  con  nuestro  propósito  de  trabajar  sólo  con  bases  ortonormales,  está  claro 
que  para  el  resto  de  este  capítulo  nos  limitarémos  a cambios  de  base  que  son  transformaciones 
ortogonales.  Sobra  decir,  sin  embargo,  que  todas  las  propiedades  mencionadas  a partir  de  aquí  si- 
guen siendo  válidas  para  transformaciones  lineales  arbitrarias. 


4.4.  Ejemplo  concreto 


A este  punto  conviene  ilustrar  algunas  de  las  propiedades  estudiadas  con  unos  ejemplos  con- 
cretos. Consideramos  el  cambio  de  coordenadas  en  R2,  parametrizado  por  la  matriz 


(M-Jj  = 


(4.40) 


con  ay  b números  reales  arbitrarios.  Tenemos  que  det(M  1 ) = ah,  de  modo  que  en  general  M 1 
no  es  una  transformación  ortogonal.  Sin  embargo,  para  a = b = 1,  AI ~1  se  reduce  a una  rotación 
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Figura  4.2:  El  cambio  de  base  (4.40)  con  a = 2\[2  y b = s/2/2  (izquierda)  y a = b = 2\f2  (derecha).  En 
el  segundo  caso,  una  base  ortonormal  transforma  en  otra  base  ortogonal,  pero  no  normalizada. 


bajo  un  ángulo  f en  sentido  contrarreloj.  Por  otro  lado,  si  a - b / 1,  M~l  transforma  una  base 
ortonormal  en  una  base  ortogonal,  pero  no  normalizada,  puesto  que  aparte  de  una  rotación  con 
ángulo  j,  escalea  los  vectores  de  base  con  un  factor  a2. 

Sea  ahora  { |e¿)}  una  base  ortonormal,  es  decir 


Entonces  la  nueva  base  { |e')}  viene  dada  en  función  de  los  vectores  de  la  base  vieja  como  (4.4) 

14)  = ^=|e*>  + ^=\ey),  \e'y)  = --||ex)  + ±\ey),  (4.42) 

y vice  versa 

|ex>  = 4h4>  - 4-14),  \ey)  = 4,10  + 4-IO-  (4-43) 

V 2iCL  \ 2jCl 


yV  »' 


Un  vector  \v),  que  en  la  base  { |e¿)}  tiene  componentes  |u)  = y/2b\ey ) tiene  en  la  nueva  base  la 
forma  \v)  = \e'x)  + \e'y ),  puesto  que  por  (4.5) 

/ Í 0 LÍM  ,AAA* 


V V2a  V2b  J V 42&  ) V 1 / 

Una  aplicación  lineal  (w\  = (ex|  + 2(ey|  tendrá  en  la  base  {(e'|}  componentes 

, . a + 2b  . — a + 2b  . 

w = ~W{t  ] + ~7T{e'’ 

o bien  por  (4.16),  o bien  por  la  la  multiplicación  de  matrices 


( V2  a 

_2_  N 

V2b 

f a+26 

— a+26  \ 

[ * 

\ V2a 

1 

s/2b  1 

1 

) 

El  producto  escalar  entre  los  vectores  (iu|  y |i>)  tiene  el  mismo  valor  en  las  dos  bases  { | e¿ ) } y 
{Je))}/  yaque 

(w\v)  = WiV 1 = O + 2V2  b = 2\¡2b 

= wW<  = + ZZ±A  = 2^26.  (4.47) 
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Dado  que  {|e¿}}  es  una  base  ortonormal  en  R2,  la  métrica  en  esta  base  es  la  euclídea  5i:¡ . Sin 
embargo  la  forma  de  la  métrica  en  la  base  { |e')}  se  calcula  con  (4.25),  siendo  de  la  forma 

a2+b2  b2-a2  \ 

2 2 \ 

b2  —a2  a2+b2  ) 

Las  componentes  del  vector  covariante  ( v | correspondiente  a 
dadas  respectivamente  por  (ejerc.) 

vx  = 0,  vy  = V%b,  v'x  = b2, 

de  modo  que  la  norma  ||  |i>)  ||  en  ambas  bases  viene  dado  por 

|||^)||2  = ViV1  = 0 + (V2  b)2 

= v'y1  = b2  + b2  = 2b2.  (4.50) 

Por  lo  tanto,  la  norma  de  vectores  también  es  independiente  de  la  base  en  que  se  calcula,  como 
es  de  esperar,  por  lo  menos  siempre  y cuando  se  usa  la  misma  medida  en  ambas  bases. 

Miremos  esto  último  en  un  poco  más  de  detalle:  el  resultado  calculado  arriba  implica  que  los 
observadores  O y O',  que  usan  los  sistemas  de  referencia  { ¡ e¿ ) } y { |<-') } respectivamente,  estarán 
de  acuerdo  sobre  la  longitud  de  vectores,  si  los  dos  están  de  acuerdo  en  usar  como  unidad  de 
longitud  la  norma  ||  | e^) ||  del  vector  de  base  de  \ex).  En  este  caso,  las  reglas  de  transformación  de 
vectores  co-  y contravariantes,  de  la  métrica  y del  producto  escalar  les  dicen  como  relacionar  los 
datos  de  ambos  observadores. 

Sin  embargo,  en  la  práctica  || \ex)  ||  no  es  la  unidad  de  longitud  más  natural  para  el  observador 
O' . Esto  está  claro  en  el  caso  donde  a = /;  / 1 (véase  Figura  4.2),  donde  la  base  { c-'} } también  es 
ortogonal.  En  este  caso.  O'  cogerá  de  manera  natural  ||  |e'f:)  ||  como  unidad  de  longitud  y usará  la 
métrica  euclidea  ó(  / como  métrica  en  su  sistema  de  referencia  y encontrará  que  según  él  las  dis- 
tancias son  un  factor  a 2 (=  b2)  más  cortas  de  lo  que  afirma  O.  Este  efecto  ocurre  en  general, 
también  para  base  no-ortogonales  y/ o bases  con  vectores  con  distintas  normas  (según  O').  Con- 
cretamente O1  afrimaría  que  el  vector  u)  tiene  norma  ||  \v)  ||  = \/2  en  su  sistema  de  referencia, 
tanto  en  el  caso  a = b como  a / b. 

En  general  los  observadores  O y O'  sólo  estarán  de  acuerdo  sobre  las  distancias  en  ambas 
sistemas  de  referencias  si  los  dos  utilizan  bases  cartesianas  que  están  normalizadas  de  la  misma 
manera  (es  decir,  si  usan  la  misma  unidad  de  longitud).  En  otras  palabras,  sólo  estarán  de  acuerdo 
si  el  cambio  de  coordenadas  M-1  transforma  la  base  ortonormal  {| e¿)}  en  otra  base  ortonormal 
{ |e')},  y por  lo  tanto  deja  la  métrica  euclidea  invariante.  Como  hemos  visto  en  la  sección  anterior, 
son  precisamente  las  transformaciones  ortogonales  (4.35)  que  tienen  esta  propiedad.  Aunque  en 
general  todas  las  transformaciones  preservan  el  producto  escalar  y la  norma  en  el  sentido  de 
(4.47)  y (4.50),  se  suele  decir  que  sólo  las  transformaciones  ortogonales  preservan  las  distancias. 


|zi)  en  las  bases  {|e¿)}  y ||e')}  vienen 
vy=b21  (4.49) 

= 2b2 


4.5.  Álgebra  de  tensores 

En  la  sección  anterior  hemos  definido  los  vectores  contravariantes  xl  y covariantes  Xi,  que 
bajo  cambios  de  coordenadas  transforman  como 

xH  = JVPjxi,  x\  = (M~1yixj,  (4.51) 

y que  están  relacionados  a través  de  la  métrica  5,:l  y la  métrica  inversa  como 

Xi  = SijXp , x1  = 8l^Xj.  (4-52) 


68 


Con  estas  definiciones  (4.51),  se  puede  construir  objetos  más  generales:  los  escalares  y los  tenso- 
res. 


Un  escalar  <fi  es  un  objeto  que  tiene  el  mismo  valor  en  todos  los  sistemas  de  referencia 

(j)'  = 0.  (4.53) 

En  otras  palabras,  un  escalar  es  un  invariante  bajo  cambios  de  coordenadas.  Un  ejemplo  de  un 
escalar  es  el  producto  escalar  de  dos  vectores,  como  hemos  visto  previamente.  Del  mismo  modo, 
una  función  escalar  (o  un  campo  escalar)  es  una  función  <¡>{xl)  que  asigna  a cada  punto  x un  valor 
numérico  4>(xl).  Dado  que  es  una  función  escalar,  f es  invariante  bajo  cambios  de  coordenadas: 

(j)r  (xH)  = <t>{ x i).  (4.54) 

En  general  f será  una  función  de  xl  diferente  que  á>  de  xH,  pero  los  dos  asignarán  el  mismo  valor 
numérico  al  mismo  punto  del  espacio. 

Considérese  ahora  el  objeto  7’';/  construido  de  los  vectores  contravariantes  a1  y />'  a través 
del  producto  exterior  o el  producto  tensoriah  = a'b1 . Matemáticamente  hablando  es  un  objeto 
que  vive  en  el  espacio  x RN,  pero  lo  que  realmente  nos  interesa  es  cómo  transforma  bajo  un 
cambio  de  base.  De  la  definición  de  los  vectores,  está  claro  que  transforma  como 

Tij  = a^b'J  = M\akMhbl  = M\M3iTkl.  (4.55) 

Definimos  un  tensor  contravariante  de  rango  2 como  cualquier  objeto  de  N 2 componentes  que  trans- 
forma como  (4.55).  Obsérvese  que  un  producto  tensorial  de  dos  vectores  contravariantes,  como 
Tu,  siempre  es  un  tensor  contravariante,  pero  no  todos  los  tensores  contravariantes  de  rango  2 
se  pueden  escribir  como  el  producto  tensorial  de  dos  vectores  contravariantes. 

Del  mismo  modo  podemos  definir  un  tensor  covariante  de  rango  2 como  un  objeto  T¿j  de  *RW  x 
*8^,  que  transforma  como 

Tij  = (M-y^M-1)^,  (4.56) 

y en  general  un  tensor  mixto  de  rango  m contravariante  y rango  n covariante  (o  simplemente  un  tensor 
de  rango  (m,  n))  un  objeto  de  1^  x . . . x R^  x *RJV  x . . . x *RW  que  transforma  como  como 

= Milfcl...Mi™fcra(M-1),1J-1...(M-1),»;#Brfcl-"fc™Ji...jB.  (4.57) 

En  otras  palabras,  cada  índice  co(ntra)variante  transforma  como  si  fuera  el  índice  de  un  vector 
co(ntra)variante. 

Comparando  esta  definición  con  las  reglas  de  transformación  (4.25)  de  la  métrica,  vemos  que 
la  métrica  gl3  es  en  realidad  un  tensor  covariante  de  rango  2.  De  la  misma  manera  se  puede  pensar 
en  un  vector  co(ntra)variante  como  un  tensor  de  rango  1 y un  escalar  como  un  tensor  de  rango  0. 

Por  último,  es  útil  introducir  los  siguientes  tensores  importantes:  la  delta  de  Kronecker,  definida 
en  (4.13)  y el  tensor  de  Levi-Civita  en'"w,  definida  como 

{1  cuando  (Íi...Ín)  es  una  permutación  par  de  (12. ..IV), 

— 1 cuando  (¿i...íjv)  es  una  permutación  impar  de  (12. ..N),  (4.58) 

0 en  todos  los  demás  casos. 

Por  construcción  la  delta  de  Kronecker  es  un  tensor  simétrico.  La  delta  es  en  realidad  la  variante 
(1, 1)  de  la  métrica  de  R^,  es  decir  Slj  es  los  mismo  que  dtJ  con  un  índice  subido: 

Sij=SikSkj.  (4.59) 

La  delta  de  Kronecker  es  un  tensor  fundamental,  lo  que  quiere  decir  que  mantiene  la  misma  forma 
en  cualquier  sistema  de  referencia: 

5'ij  = Mik{M~1)lj  Ski  = ¿V  (4.60) 
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Insistimos  otra  vez  que  no  se  debería  confundir  la  delta  de  Kronecker  con  la  matriz  identidad 
(4.7):  la  matriz  identidad  es  una  transformación  (trivial),  mientras  la  delta  es  un  tensor  que  trans- 
forma bajo  transformaciones  en  M.N . 

Por  construcción,  el  tensor  de  Levi-Civita  es  completamente  antisimétrico  en  todos  sus  índi- 
ces. Eso  hace  que  estrictamente  hablando  no  es  un  tensor,  puesto  que  en  sus  reglas  de  transforma- 
ción aparecen  el  signo  y el  valor  absoluto  del  determinante  (det  M-1)  del  cambio  de  coordenadas 

(M-Jf 

e'h-ÍN  = sgn{detM-1)\detM-1\Miljl...MÍNjNejl-jN.  (4.61) 

Objetos  que  transforman  con  el  signo  del  determinante  de  la  transformación  se  llaman  pseudo- 
tensores  y objetos  que  transforman  con  el  valor  absoluto  del  determinante  de  la  transformación 
(a  la  potencia  p ) se  llaman  tensor  densidades  (de  peso  p).  Estrictamente  hablando  el  tensor  de  Levi- 
Civita  es  por  lo  tanto  una  pseudo-tensor  densidad  de  peso  l.5 

Como  la  delta  Kronecker,  también  el  tensor  de  Levi-Civita  es  un  tensor  fundamental.  De  la 
regla  de  transformación  (4.61)  deducimos  que 

eHl-ÍN  = sgn(det  M-1)  | det  Af"1 1 AP1  h ...MÍN  jNejl~jN 

= det  Aí_1  det  Me*1"4 *  = e¿1-ÍJV,  (4.62) 

donde  en  la  segunda  igualdad  hemos  utilizado  la  identidad 

det  M eil"'ÍN  = M'x  h ...,\/'  v yvcn  . (4.63) 

que  se  demuestra  fácilmente  de  la  propia  definición  del  determinante 

det M = ± ejí  -jN.  (4.64) 


4.6.  Operaciones  con  tensores 


Una  primera  propiedad  de  los  tensores  es  una  generalización  directa  de  una  propiedad  cono- 
cida de  vectores:  de  las  reglas  de  transformación  (4.51)  ((4.57))  está  claro  que  si  una  componente 
de  un  vector  (tensor)  es  cero  en  una  base,  en  general  no  lo  será  en  otra  base.  Sin  embargo,  también 
está  claro  que  si  todas  las  componentes  de  un  vector  (tensor)  son  cero  en  una  base,  lo  serán  en 
todas  las  bases. 

De  la  regla  de  transformación  (4.57)  también  está  claro  que  si  A1' •••  y Blm"  j ...  son  dos  tensores 

de  rango  (m,n),  la  combinación  lineal 

CU-imj>...jn  = (4-65) 

también  es  un  tensor  de  rango  ( m , n). 

Si  un  tensor  tiene  la  propiedad  que  • • = T-5*- ••  , decimos  que  T es  un  tensor  simétrico  en  i 
y j.  Si  tiene  la  propiedad  que  Ty  --  - — T-7*---  , decimos  que  es  un  tensor  anti-simétrico  en  i y j. 
Utilizando  (4.65)  se  deriva  directamente  que  si  un  tensor  es  (anti-)simétrico  en  una  base,  lo  es  en 
todas. 


De  la  forma  en  que  hemos  introducido  los  tensores  también  está  claro  que  el  producto  tenso- 
rial  de  un  tensor  de  (m,  n)  con  uno  de  rango  (p,  q) 


cn. 


k\...kp 


= A11 


••• im  . . f)ki...kp 

31  ■■■JnJD 


h ...la 


(4.66) 


5E1  estudiante  atento  habrá  observado  que  al  ser  (M_1)*j  una  transformación  ortogonal,  tenemos  que  | det  M~1\  = 

1.  Sin  embargo  preferimos  poner  el  factor  | detM-1|  explícitamente  por  razones  pedagógicas,  para  demostrar  que  el 

tensor  de  Levi-Civita  es  un  pseudo-tensor  bajo  las  transformaciones  ortogonales,  pero  una  pseudo-tensor  densidad  bajo 

transformaciones  más  generales. 
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es  un  tensor  de  rango  (m  + p,  n + q). 

Se  puede  cambiar  el  rango  de  los  tensores  utilizando  la  métrica  para  "bajar  índices".  Siendo 
...jn  un  tensor  de  rango  (m.  n),  entonces 

C:-""  1 /.*./*: • 4/ ,1'; (4.67) 

es  un  tensor  de  rango  (m  — 1,  n + 1).  De  la  misma  manera  se  puede  "subir  índices"  con  la  métrica 
inversa  S’:i  y convertir  un  tensor  de  rango  (m,  n)  en  uno  de  rango  (m  + 1,  n — 1).  Un  ejemplo  de 
esto  ya  hemos  visto  en  (4.52),  al  cambiar  un  vector  covariante  en  uno  contravariante. 

Se  puede  bajar  el  rango  de  un  tensor  contrayendo  un  índice  covariante  con  uno  contravarian- 
te. Si  es  un  tensor  de  rango  (m,  n),  entonces 

(■U'Ím  : = •I'1""”'  d-  (4-68) 


es  un  tensor  de  rango  (m—  1,  n—  1).  Lo  mismo  se  puede  hacer  contrayendo  dos  indices  del  mismo 
tipo  con  la  métrica  o la  inversa.  Por  ejemplo 


Dl 


Jl-Jr 


= SkiA 


u 


Jl--  • Jn 


(4.69) 


es  un  tensor  de  rango  (m—  2,  n).  Visto  así,  el  producto  escalar  es  un  tensor  de  rango  0 (un  escalar) 
que  surge  de  la  contracción  del  producto  tensorial  de  dos  vectores  Otro  ejemplo  es  que 
la  traza  T‘  ¡ = Srfl1'3  = SZJ  T¿j  de  un  tensor  de  rango  2 es  un  escalar.  Esto  explica  el  conocido 
resultado  de  que  la  traza  tiene  el  mismo  valor  en  todas  las  bases. 

El  operador  <9,  la  derivada  con  respecto  a las  coordenadas,  se  comporta  como  un  vector.  Para 
ver  esto,  es  mejor  mirar  como  actúa  sobre  un  campo  escalar.  Consideramos  la  derivada  parcial 
dV/dx1.  Por  la  regla  de  la  cadena  tenemos  que 


dV  dV  dx'k  dV  , 

— - = = Mk 

dxl  dx'k  dxl  dx'k 


(4.70) 


donde  en  la  última  igualdad  hemos  utilizado  la  relación  (4.5)  entre  las  coordenadas  x1  y x".  En 
otras  palabras  la  derivada  diV  = dV/dx1  tiene  la  misma  regla  de  transformación  que  un  vector 
covariante: 

d¡V  = (M~1y  idjV.  (4.71) 

Del  mismo  modo  se  puede  demostrar  que  la  derivada  dlV  = dV / dx¡  transforma  como  un  vector 
contravariante.  En  notación  vectorial  muchas  veces  se  utiliza  el  operador  nubla  V = (<9*.)e¿  y se 
identifica  con  el  operador  matemático  de  la  derivada  direccional. 

Tomando  en  cuenta  el  hecho  que  y O1  se  comportan  como  un  vector  covariante  y contrava- 
riante respectivamente,  se  puede  utilizar  estos  operadores  para  actuar  sobre  campos  tensoriales. 
Dado  que  la  derivada  de  un  campo  escalar  es  un  vector,  en  general  la  derivada  dl  de  un  campo 
tensorial  de  rango  (m,  n)  es  un  tensor  de  rango  ( m + 1,  n)  y la  derivada  0,  de  un  campo  tensorial 
de  rango  (m,  n)  es  un  tensor  de  rango  (m,  n + 1). 

De  este  modo  se  puede  interpretar  los  conocidos  operadores  diferenciales  en  R3  (la  mayoría 
fácilmente  generalizable  a N dimensiones)  en  términos  de  (contracciones  de)  vectores  y tensores: 
el  gradiente  V(f>  = d'é  e,  de  un  campo  escalar  <i>  es  un  vector,  al  ser  la  derivada  de  un  escalar.  La 
divergencia  V • A = 0,  A'  de  un  vector  contra  variante  A1  es  un  escalar,  al  ser  el  producto  escalar 
entre  los  vectores  <9,  y A1.  El  laplaciano  A </>  = didlcj)  de  un  campo  escalar  </>  es  un  escalar  por  ser 
el  producto  escalar  entre  los  vectores  y dl6.  Finalmente,  el  rotacional  V x A = ei:'kd:jAi¡:  de  un 
vector  covariante  es  un  vector  contravariante,  por  ser  la  contracción  del  tensor  de  Levi-Civita 
tridimensional  eljk  con  el  tensor  de  rango  (0,  2)  <9,  A:¡ . Esta  operación  corresponde  al  producto 
vectorial  entre  los  vectores  <9,  y A ’ y solamente  está  definido  en  tres  dimensiones,  porque  sólo  en 
tres  dimensiones  el  tensor  de  Levi-Civita  eljk  puede  convertir  un  tensor  antisimétrico  de  rango  2 
en  un  vector. 
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La  gran  ventaja  del  uso  de  tensores  es  que  si  una  relación  tensorial  del  tipo 

+ Cil"'imDjl...jn  (4.72) 

es  válida  en  una  base,  también  lo  será  en  cualquier  otra  base,  puesto  que  los  dos  lados  de  la 
ecuación  transforman  bajo  un  cambio  de  base  de  la  misma  manera.  Un  ejemplo  de  esta  propiedad 
hemos  visto  ya  en  el  Capítulo  2,  al  demostrar  la  covariancia  de  la  Segunda  Ley  de  Newton  bajo 
rotaciones.  Por  lo  tanto,  el  hecho  de  que  por  el  Principio  de  la  Relatividad  las  leyes  de  la  física 
no  dependan  del  sistema  de  referencia  utilizado,  implica  que  estas  leyes  deberían  escribirse  en 
término  de  objetos  que  transforman  bien  bajo  cambios  de  coordenadas,  es  decir  en  términos  de 
escalares,  vectores  y tensores.  En  otras  palabras,  la  estructura  matemática  restringe  la  forma  de 
las  leyes  a ecuaciones  vectoriales  y tensoriales.  Este  principio  se  llama  el  Principio  de  Covariancia 
y veremos  que  forma  la  base  del  formalismo  matemático  de  la  teoría  de  la  relatividad. 
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Capítulo  5 

Relatividad  especial  en  formulación 
covariante 


A partir  de  ahora  el  espacio  en  sí  mismo  y el  tiempo  en  sí  mismo  están  destinados  a diluirse 
en  meras  sombras  y sólo  un  tipo  de  unión  de  los  dos  conservará  una  realidad  independiente. 
(H.  Minkowski,  1908) 


Hasta  ahora  apenas  hemos  hecho  algo  nuevo:  en  el  Capítulo  3 hemos  repasado  la  relatividad 
especial  y en  el  Capítulo  4 un  poco  de  algebra  elemental.  En  este  capítulo  combinaremos  las 
técnicas  de  Capítulo  4 con  la  física  de  Capítulo  3 para  llegar  a una  formulación  de  la  relatividad 
especial  que  sea  independiente  de  los  observadores.  Aunque  estrictamente  hablando  tampoco  en 
este  capítulo  haremos  nada  nuevo,  la  formulación  introducida  aquí  nos  será  de  extrema  utilidad 
para  el  desarollo  de  la  relatividad  general. 

A partir  de  este  capítulo  utilizaremos  las  llamadas  unidades  naturales  , en  las  que  pondremos 
c = 1.  Una  de  las  lecciones  de  este  capítulo  es  que  el  tiempo  se  comporta  como  una  coordenada 
más  en  el  espaciotiempo  y la  mejor  manera  de  ver  esto  es  utilizar  unidades  naturales.1 


5.1.  El  espacio  de  Minkowski  (otra  vez) 


Discutiremos  ahora  la  estructura  del  espacio  y el  tiempo  y sus  propiedades  algebráicas  y geo- 
métricas. La  imagen  del  espacio  y el  tiempo  que  surge  de  la  relatividad  especial  es  una  donde 
ambos  están  íntimamente  conectados  y forman  una  estructura  llamada  el  espaciotiempo.  La  di- 
rección temporal  es  distinta  a las  espaciales,  pero  la  distinción  es  mucho  menos  clara  que  en  la 
física  newtoniana.  No  hay  una  sola  dirección  temporal  absoluta,  sino  que  cada  observador  ve  su 
propia  dirección  temporal,  que  es  distinta  de  la  de  los  demás. 

Consideramos  el  espacio  de  Minkowski,  un  espacio  continuo  4-dimensional,  donde  cada  pun- 
to corresponde  con  un  suceso,  es  decir  un  evento  que  ocurre  en  una  posición  (x.  y,  z)  en  un  mo- 
mento t en  cierto  sistema  de  coordenadas.  Cada  suceso  está  por  lo  tanto  caracterizado  por  un 

1 Puede  ser  al  principio  un  poco  confuso  que  cantidades  físicas  (newtonianamente)  distintas  ahora  tengan  la  misma 
dimensión,  como  tiempo  y distancia,  o energía,  masa  y momento.  Pero  expresar  una  distancia  como  un  intervalo  de 
tiempo  o vice  versa  no  tan  es  raro,  incluso  en  la  vida  cotidiana.  Decir  que  la  distancia  Madrid-Granada  son  4 horas  y 
medio  en  coche  es  un  ejemplo  familiar.  Para  recuperar  las  dimensiones  familiares  sólo  hace  falta  introducir  en  los  sitios 
adecuados  los  factores  c adecuados. 
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vector  cuadrimensional 


/ x°  \ 

( 1 \ 

X 1 

X 

X 2 

y 

V *3 ) 

\ z / 

Hemos  visto  en  el  Capítulo  3 que  la  norma  \\x^  ||  de  los  vectores  se  define  en  el  espacio  de  Min- 
kowski  como 

|¡a^||2  = (a;0)2  - (a;1)2  - (a;2)2  - (a;3)2.  (5.2) 


Del  Capítulo  4 sabemos  que  con  esta  definición  de  la  norma,  hemos  introducido  implícitamente 
una  métrica.  Efectivamente,  se  puede  escribir  (5.2)  como 


|®'*|2 

= x^  -- 

donde  77^  se  llama  la  métrica 

de  Minkoivski  y 

es  de  ] 

/ 1 

0 

0 

° \ 

0 

-1 

0 

0 

V ^ = 

0 

0 

-1 

0 

'v  0 

0 

0 

-1  / 

rj^x^x1' , 


= diag  (1,-1, -1,-1). 


(5.3) 


(5.4) 


El  elemento  de  línea,  que  resume  las  propiedades  geométricas  del  espaciotiempo  viene  por  lo 
tanto  dado  por 

ds 2 = rj^dx^dx1'  = (dx0)2  — ( dx 1)2  — (da;2)2  — (da;3)2.  (5.5) 

La  métrica  y su  inversa  nos  permiten  subir  y bajar  los  índices  y convertir  vectores  covariantes  en 
contravariantes  y vice  versa. 


Xfj,  = r¡^xv , x ^ = rfvxv  (5.6) 

de  modo  que  el  producto  escalar  se  pueden  escribir  como 

= r^ady  = rj^Xfjy,,  = ady,  (5.7) 

o,  explícitamente  en  componentes 

= X0y°  + Xxy1  + x2y2  + X3y3  = x°y°  - x1y1  - x2y2  - x3y3.  (5.8) 


Como  vemos,  hay  que  tener  un  particular  cuidado  al  subir  y bajar  índices  con  los  signos  que 
aparecen  por  la  métrica  (5.4).  Esto  es  una  gran  diferencia  entre  la  geometría  euclídea  y la  del 
espacio  de  Minkowski:  las  componentes  de  un  vector  cambian  al  pasar  el  vector  de  covariante  a 
contravariante  o vice  versa.  En  particular,  debido  a los  signos  en  la  métrica  (5.4),  las  componentes 
espaciales  adquieren  un  signo.  Si  un  vector  contravariante  tiene  componentes 


/ 1 \ 

2 

3 

W 


(5.9) 


el  vector  covariante  correspondiente  tiene  componentes  a,,  = (1,  —2,  —3,  —4).  Si  la  métrica  glu, 
tiene  una  forma  más  general,3  la  relación  entre  las  componentes  de  vectores  co-  y contravariantes 
será  más  complicada. 

2 A veces  la  métrica  se  presenta  con  los  signos  opuestos  (es  decir  = diag  (—1. 1, 1. 1)).  El  signo  de  la  métrica  es 
puro  convenio  y,  aunque  algunas  fórmulas  pueden  tener  signos  diferentes,  la  física  es  por  supuesto  independiente  del 
convenio  utilizado.  Para  un  resumen  de  los  convenios  que  utilizamos  en  este  curso,  referimos  a Apéndice  A. 

3 Aquí  referimos  tanto  a la  métrica  del  espacio  de  Minkowski  en  coordenadas  no-cartesianas,  como  a métricas  de 
espacios  más  complejos. 


74 


La  dirección  temporal  destaca  en  la  métrica  (5.4)  porque  lleva  el  signo  contrario  de  las  direc- 
ciones espaciales.  Esto  tiene  como  consecuencia  directa  que  la  norma  no  sea  definida  positiva, 
es  decir:  existen  vectores  cuya  norma  al  cuadrado  es  negativa.  Se  dice  que  la  métrica  (5.4)  tiene 
signatura  (3,1).  El  espacio  de  Minkowski  por  lo  tanto  no  es  euclídeo,  sino  lorentziano.  La  diferencia 
con  el  espacio  euclídeo  es  la  presencia  de  la  dirección  temporal  que  hace  posible  una  dinámica. 

Los  vectores  se  llaman  vectores  temporales  si  su  norma  al  cuadrado  es  positiva,  vectores  nulos 
si  su  norma  es  cero  y vectores  espaciales  si  la  norma  al  cuadrado  es  negativa.  Entre  los  vectores 
temporales  distinguimos  los  vectores  temporales  dirigidos  hacia  el  futuro  y los  vectores  temporales 
dirigidos  hacia  el  pasado,  dependiendo  de  si  el  producto  escalar  entre  el  vector  temporal  y el  vector 
de  base  et  es  positivo  o negativo.  Una  curva  se  llama  curva  temporal  si  en  cada  punto  de  la  curva 
el  vector  tangente  es  un  vector  temporal.  De  igual  modo  se  llama  curva  espacial  (nula)  si  en  cada 
punto  el  vector  tangente  es  espacial  (nulo).  En  general  una  curva  arbitraria  puede  ser  temporal, 
nula  o espacial  por  trozos. 

El  conjunto  de  todas  las  rectas  nulas  que  pasan  por  un  punto  x1'  se  llama  cono  de  luz  en  x/l . La 
estructura  del  cono  de  luz  y la  distinción  entre  vectores  y curvas  temporales,  nulos  y espaciales 
está  bien  definida,  en  el  sentido  de  que  es  igual  para  todos  los  observadores.  Esto  es  porque  el 
grupo  de  Lorentz,  que  relaciona  diferentes  observadores,  preserva  esta  estructura  del  espacio  de 
Minkowski,  como  veremos  en  la  siguiente  sección. 


5.2.  El  grupo  de  Lorentz 


El  grupo  de  Lorentz  C se  define  como  el  grupo  de  transformaciones  lineales  y homogéneas4 

x'11  = A V (5.10) 

que  dejan  la  métrica  (5.4)  invariante, 

Vnv  = Ap^AA„r7pA.  (5.11) 

Comparando  esta  expresión  con  la  regla  de  transformación  (4.56),  vemos  que  ri¡u,  transforma  co- 
mo un  tensor  de  rango  (0, 2)  bajo  las  transformaciones  de  Lorentz  (como  era  de  esperar).  Además, 
la  definición  (5.11)  tiene  mucha  similitud  con  la  formula  (4.37)  y con  la  definición  (4.35)  de  las 
transformaciones  ortogonales  en  Rw.  Efectivamente,  de  (5.11)  se  deriva  fácilmente  que 

(A-1)AP  = r¡pli  Ap„  rf A.  (5.12) 

Comparando  esta  definición  con  (4.38)  y (4.39),  vemos  que  de  cierto  modo  esta  fórmula  nos 
está  diciendo  que  la  transpuesta  de  una  transformación  de  Lorentz  es  su  inversa,  una  propie- 
dad de  las  transformaciones  ortogonales,  sólo  que  aquí  la  transpuesta  está  definida  con  respecto 
a la  métrica  de  Minkowski  Esto  es  general:  la  única  diferencia  entre  las  transformaciones  en 
el  espacio  de  Minkowski  y las  transformaciones  ortogonales  en  el  caso  euclidea  es  que  aquí  apa- 
rece i\¡iv  en  lugar  de  la  métrica  euclidea  d,:) . Podemos  interpretar  por  lo  tanto  las  transformaciones 
de  Lorentz  (5.11)  como  el  grupo  de  transformaciones  ortogonales  en  el  espacio  de  Minkowski  y 
las  formulas  (5.11)  y (5.12)  como  los  análogos  lorentzianos  de  (4.37)  y (4.35)  en  RA. 

Del  Capítulo  4 podemos  derivar  matemáticamente  muchas  propiedades  que  ya  habíamos 
visto  en  el  Capítulo  3.  En  particular  sabemos  que  un  vector  covariante  transforma  con  la  matriz 
inversa  de  un  vector  contravariante 


= (A”1)  (5-13) 

4Hasta  ahora  nos  hemos  referido  a una  transformación  de  Lorentz  como  la  que  relaciona  x y t como  en  (3.19).  A veces 
a (3.19)  se  le  llama  una  transformación  de  Lorentz  especial  o por  el  término  en  inglés,  boost  (empujón),  para  distinguirla  de 
los  demás  elementos  del  grupo  de  Lorentz.  A partir  de  ahora  llamaremos  una  transformación  de  Lorentz  a cualquier 
elemento  de  C. 
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de  modo  que  el  producto  escalar  (y  por  lo  tanto  la  norma)  de  vectores  en  el  espacio  de  Minkowski 
se  conserva.  Efectivamente,  el  producto  escalar  entre  dos  vectores  x M e y1'  transforma  como 

w*  = Zp(A -lY^vyv  = XpS^y"  = xpyp.  (5.14) 

Igual  que  en  el  Capítulo  4,  los  operadores  diferenciales  dp  = d/OxJ1  y O11  = d/dxp  se  compor- 
tan como  vectores  co-  y contravariantes  respectivamente,5  como  se  puede  averiguar  fácilmente 
a través  de  la  regla  de  la  cadena.  La  divergencia  (cuadrimensional)  de  un  campo  vectorial  A1'  se 
puede  escribir  por  lo  tanto  como  el  producto  escalar  entre  los  vectores  dp  y A/l, 

d^A'1  = dtA'  + V-Á  = d0A°  + di^1  + d2A 2 + d3A3.  (5.15) 

De  la  misma  manera  se  puede  ver  el  laplaciano  cuadrimensional  (a  veces  llamado  el  d' alambertiano) 
como  la  norma  del  operador  d, 

□ = dpdP  = di-  di  - di  - di  (5.16) 

La  invariancia  del  producto  escalar  (5.7)  nos  será  de  gran  utilidad  a la  hora  de  formular  una 
física  covariante.  En  particular  explica  por  qué  las  leyes  de  continuidad  (leyes  de  conservación 
en  teorías  de  campos)  tienen  la  forma  de  una  divergencia  cuadrimensional  (5.15)  y en  sistemas 
dinámicos  el  operador  diferencial  de  segundo  orden  más  común  es  el  d'alambertiano  (5.16). 

La  estructura  del  grupo  de  Lorentz  es  un  poco  más  complicada  que  la  del  grupo  ortogonal 
0{N)  del  espacio  euclídeo,  debido  a la  presencia  de  la  dirección  temporal  con  el  signo  opuesto  a 
las  direcciones  espaciales.  Igual  que  en  E N , sacando  el  determinante  de  (5.12),  se  ve  que 


det  A = ±1.  (5.17) 

Esto  divide  el  grupo  de  Lorentz  en  dos  partes,  según  el  signo  del  determinante.  Las  transforma- 
ción con  determinante  — 1 son  reflexiones  y no  preservan  la  orientación  de  la  base,  mientras  las 
transformaciones  con  determinante  1 son  cambios  de  base  que  sí  perservan  la  orientación.  Sólo 
éstos  últimos  forman  un  subgrupo  del  grupo  de  Lorentz,  puesto  que  la  identidad  pertenece  a esta 
parte.  Este  subgrupo  £+  se  llama  el  grupo  propio  de  Lorentz. 

De  (5.11)  sacamos  otra  manera  de  dividir  el  grupo  de  Lorentz  en  dos  partes:  cogiendo  la 
componente  (00)  de  (5.11),  vemos  que 

1 = (A°0)2  - (A'o)2  - (A20)2  - (A30)2.  (5.18) 

Tenemos  por  lo  tanto  que  la  componente  A°o  de  una  transformación  de  Lorentz  tiene  que  satis- 
facer la  condición  que  (A°o)2  > 1,  o en  otras  palabras 

A%  > 1 ó A°0  < -1.  (5.19) 

Las  transformaciones  con  A°o  < —1  invierten  la  dirección  temporal,  mientras  las  que  tienen 
A°o  > 1 la  preservan.  Sólo  la  parte  con  A°0  > 1 forma  un  subgrupo,  llamado  el  grupo  ortocrono  de 
Lorentz  Zfl . 

Vemos  por  lo  tanto  que  el  grupo  de  Lorentz  £ se  divide  en  4 partes  disconexas,  caracteriza- 
das por  el  signo  del  determinante  y el  signo  de  la  componente  A°o.  De  estas  4 partes,  sólo  la 
parte  de  las  transformaciones  propias  y ortocronas  £.  forma  un  subgrupo,  puesto  que  contie- 
ne la  identidad.  Discutiremos  ahora  en  más  detalle  las  transformaciones  de  este  subgrupo.  Las 
transformaciones  pertenecientes  a las  demás  partes  están  relacionadas  con  las  de  C\  a través  de 
reflexiones  y/o  cambios  de  orientación  de  la  dirección  temporal. 

5 Debido  a los  signos  en  la  métrica,  las  componentes  espaciales  de  de  y dp  llevan  el  signo  contrario.  Para  evitar  confu- 

- / Q*  \ 

sión  damos  las  componentes  explícitamente:  dp  = (dt-  V),  mientras  = I - J. 
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El  grupo  de  Lorentz  propio  y ortocrono  C\  consiste  en  las  transformaciones  A que  tienen 
determinante  1,  preservan  la  dirección  temporal  y preservan  la  métrica  como  en  (5.11).  Un 
ejemplo  de  una  transformación  son  las  rotaciones  en  las  tres  dimensiones  espaciales.  Es  fácil  de 
ver  que  por  ejemplo  una  rotación  en  el  plano  xy 


A*** 


/ 1 0 0 0 \ 

0 eos  9 sin  6 0 

0 — sin  9 eos  9 0 
\ 0 0 0 1 / 


(5.20) 


satisface  todas  las  condiciones  para  pertenecer  a £/.  En  otras  palabras  el  grupo  SO( 3)  de  rota- 
ciones en  R3  es  un  subgrupo  de  C,_S 


Otro  tipo  de  transformación  que  pertenece  a C+  son  las  transformaciones  especiales  de  Lo- 
rentz (3.19).  Efectivamente,  la  matriz  correspondiente 


( j — syV  o 0 \ 

—"fv  7 0 0 

0 0 10 

\ 0 0 0 1 / 


(5.21) 


también  preserva  la  métrica  . 

Es  interesante  darse  cuenta  de  que  podemos  sustituir  el  parámetro  v por 


v = — tgh  <p, 


(5.22) 


de  modo  que  7 = 1/Vl  — v2  = cosh  p y la  transformación  (5.21)  se  puede  escribir  como 


( cosh<p  sinhip  0 0 \ 

sinh  tp  cosh  p 0 0 

0 0 10 

\ 0 0 0 1 / 


(5.23) 


Esta  forma  de  escribir  un  boost  es  remarcablemente  parecida  a una  rotación  espacial  (5.20).  La 
diferencia  esencial  es  que  en  lugar  de  senos  y cosenos  aparecen  sus  equivalentes  hiperbólicos. 
En  cierto  modo  podemos  pensar  en  un  boost  como  una  "rotación  en  el  plano  tx”.  Las  funcio- 
nes hiperbólicas  aparecen  por  lo  tanto  debido  al  signo  relativo  entre  la  dirección  temporal  y la 
espacial. 

Donde  en  una  rotación  (5.20)  el  parámetro  de  rotación  9 corre  de  0 a 27t,  el  parámetro  <p  de  un 
boost  puede  tomar  cualquier  valor  en  R,  de  —00  a 00.  Decimos  por  lo  tanto  que  el  grupo  de  Lo- 
rentz es  un  grupo  no-compacto,  porque  el  intervalo  de  algunos  de  sus  parámetros  no  es  compacto. 
Esta  es  la  gran  diferencia  entre  el  grupo  de  Lorentz  y el  grupo  0(4)  de  las  transformaciones  or- 
togonales en  R4.  El  grupo  de  Lorentz  es  el  grupo  de  transformaciones  ortogonales  en  un  espacio 
4-dimensional  con  una  dirección  temporal,  lo  que  matemáticamente  se  anota  respectivamente  co- 
mo 0(3, 1)  y R1,3.  El  subgrupo  de  transformaciones  propias  y ortocronas  es  por  lo  tanto  el  grupo 
SO* (3,1). 

El  grupo  C+  (o  equivalentemente  SO  (3, 1))  consiste  por  lo  tanto  en  las  rotaciones  espacia- 
les y los  boosts,  que  se  interpretan  como  una  rotación  entre  la  dirección  temporal  y una  espa- 
cial. SO^  (3,1)  tiene  6 parámetros  independientes  que  tienen  la  siguiente  interpretación  física: 
un  elemento  de  SO^  (3, 1)  es  una  transformación  entre  dos  sistemas  de  referencia  arbitrarios  en 
movimiento  uniforme  rectilineo  con  la  misma  orientación  de  base  y la  misma  orientación  de 
la  dirección  temporal.  Tres  parámetros  corresponden  a los  ángulos  de  Euler  que  relacionan  la 

6Y  obviamente  el  grupo  0(3)  es  un  subgrupo  de  £ entero. 
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Figura  5.1:  La  línea  de  universo  de  una  partícula  masiva  es  una  curva  temporal  x^[r).  El  vector  tangente 
a la  curva,  el  cuadrivectro  velocidad,  es  un  vector  temporal.  En  cada  punto,  la  curva  entera  está  contenido 
dentro  del  cono  de  luz  de  este  punto.  La  linea  de  universo  se  puede  parametrizar  de  manera  natural  por  el 
tiempo  propio  t,  el  tiempo  medido  por  el  observador  que  se  mueve  con  la  partícula. 


orientación  espacial  de  las  dos  bases.  Otros  dos  parámetros  corresponden  dos  ángulos  indicando 
la  dirección  en  que  se  mueve  el  segundo  sistema  de  referencia  con  respecto  al  primero  y el  último 
parámetro  corresponde  con  la  velocidad  relativa  entre  los  dos  sistemas. 

Finalmente  mencionamos  que  si  no  consideramos  sólo  las  transfomaciones  homogéneas  (5.10) 
que  mantienen  el  origen  fijo,  sino  también  permitimos  transformación  inhomogéneas 

= AV  + a",  (5.24) 

es  decir,  incluimos  también  las  traslaciones  en  el  espacio  y el  tiempo,  el  grupo  que  forman  estas 
transformaciones  se  llama  el  grupo  de  Poincaré.  El  grupo  de  Poincaré  es  el  análogo  relativista 
del  grupo  de  Galilei  y consta  de  10  parámetros  independientes:  los  6 parámetros  del  grupo  de 
Lorentz  y 4 traslaciones  en  el  espaciotiempo. 


5.3.  La  dinámica  relativista  covariante 


Repasaremos  ahora  la  física  relativista  de  la  sección  3.3,  pero  en  notación  covariante,  es  decir 
sin  referirnos  a un  sistema  de  referencia  explícito. 

La  trayectoria  de  una  partícula  a través  del  espaciotiempo  se  llama  la  línea  de  universo.  La  línea 
de  universo  de  una  partícula  con  masa  mo  / 0 es  una  curva  temporal,  puesto  que  la  velocidad  de 
la  partícula  siempre  es  menor  que  la  de  la  luz.  Por  lo  tanto  en  cualquier  punto  de  la  trayectoria, 
toda  la  curva  tiene  que  estar  contenido  dentro  del  cono  de  luz  (pasado  y futuro)  en  este  punto 
(véase  Figura  5.1). 

Partículas  sin  masa  se  mueven  a lo  largo  de  curvas  nulas.  Esto  es  fácil  de  ver,  puesto  que  la 
ecuación  de  una  curva  nula  es  (a;0)2  — (a;1)2  — ( x 2)2  — (a:3)2  = 0,  lo  que  es  justo  la  ecuación  (3.15) 
de  un  pulso  de  luz  esférico  expandiéndose  desde  el  origen. 

Se  puede  parametrizar  la  línea  de  universo  de  una  partícula  masiva  utilizando  el  tiempo  propio 
t de  la  partícula:  xJ‘  = xJ!  (t).  El  tiempo  propio  es  el  tiempo  medido  por  un  observador  O que  se 
mueve  junto  con  la  partícula  y la  relación  entre  un  intervalo  infinitesimal  del  tiempo  propio  dr  y 
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el  tiempo  dt  medido  por  cualquier  otro  observador  inercial  O'  viene  dado  por  la  fórmula  (3.3)  de 
la  dilatación  del  tiempo: 

dr  = \J\  — v2  dt , (5.25) 

donde  v es  la  velocidad  de  la  partícula  con  respecto  al  observador  O'  en  el  intervalo  dr.  Para 
el  observador  O'  el  intervalo  dr  corresponde  a un  intervalo  entre  dos  puntos  y + dx11  del 
espaciotiempo 

dr2  = dt2  — dx2  — dy2  — dz2  = rj^dx^dx^ . (5.26) 

Nótese  que  por  lo  tanto  dr  es  una  cantidad  invariante,  dado  que  cualquier  otro  observador  O " 
mediría  el  mismo  intervalo.  Esta  propiedad  es  lo  que  hace  que  el  tiempo  propio  sea  particular- 
mente útil  para  la  parametrización  de  trayectorias.  La  longitud  de  la  curva  entera  o de  una  parte 
finita  se  obtiene  integrando  dr  en  un  intervalo  (in)finito. 

El  vector  tangente  a la  curva  es  la  cuadrivelocidad  uM(r)  y es  por  definición  la  derivada  de  la 
posición  con  respecto  al  tiempo  propio 


up(r) 


dx » 
dr 


(5.27) 


Para  partículas  masivas,  vJ‘  es  un  vector  temporal  y de  (5.26)  se  deriva  fácilmente  que  entonces 
la  norma  de  es  (ejerc.) 

r)tlvutluv  = 1.  (5.28) 

Para  partículas  sin  masa,  uJ‘  es  un  vector  nulo. 


Por  construcción  wh  es  un  cuadrivector  y transforma  por  lo  tanto  bien  bajo  el  grupo  de  Lo- 
rentz.  Una  manifiestación  de  esto  es  el  hecho  de  que  la  norma  es  un  invariante,  como  nos  indica 
(5.28).  Físicamente  se  interpreta  esta  propiedad  como  que  u1'  no  es  la  velocidad  newtoniana  v de 
una  partícula  por  el  espacio,  sino  una  velocidad  que  indica  el  movimiento  por  el  espaciotiempo. 
De  la  propia  definición  de  u1'  se  ve  que  las  tres  componentes  espaciales  sí  corresponden  con  las 
componentes  de  la  velocidad  newtoniana,  v = dx/dt,  aunque  con  el  factor  7 de  corrección  rela- 
tivista, mientras  la  componente  temporal  es  la  velocidad  de  la  luz,  con  el  correspondiente  factor 
relativista: 


u 


dx M dt  í 1 \ 
dt  dr  ~ 7 V ^ ) ’ 


(5.29) 


Se  puede  comprobar  que  actuando  con  un  boost  (5.21)  sobre  la  cuadrivelocidad,  u’1'  = A'V'U,  se 
recupera  la  regla  relativista  de  la  suma  de  velocidades  (3.22)  (ejerc.). 


De  la  misma  manera  se  define  la  aceleración  de  una  partícula  como  el  cuadrivector7 


aPlr)  = — . (5.30) 

dr 

Por  su  propia  definición  y la  propiedad  (5.28)  vemos  que  en  la  mecánica  relativistala  velocidad 
iij'  y la  aceleración  a1'  siempre  son  ortogonales 


= 77  = 0.  (5.31) 

ar  ¿ cLt 

La  aceleración  por  lo  tanto  siempre  es  un  vector  espacial. 

La  aceleración  relativista  es  bastante  distinta  a la  aceleración  newtoniana:  en  un  sistema  de 
referencia  específico  toma  la  forma 

n _ ( d'y/dt  \ _ f ”f4v  ■ a \ 

a 7 dt  ^ \ vdy/dt  + 'ya  ) \ ^A(v  ■ a)v  + ^2a  ) ’ 

7 A veces  se  oye  que  la  relatividad  especial  no  puede  describir  el  movimiento  acelerado  y que  para  eso  es  preciso 
recurrir  a la  relatividad  general.  Esto  es  claramente  erróneo:  la  única  restricción  que  impone  la  relatividad  especial  es  que 
se  limita  a describir  la  física  desde  el  punto  de  vista  de  los  observadores  inerciales  (i.e.  observadores  no-acelerados).  Sin 
embargo,  nada  impide  un  observador  inercial  estudiar  la  dinámica  de  una  partícula  acelerada. 
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donde  a = dv/dt  es  la  aceleración  newtoniana.  Por  lo  tanto  las  componentes  espaciales  de  oF  no 
son  simplemente  (proporcionales  a)  la  aceleración  newtoniana,  sino  también  tienen  un  término 
proporcional  a (v  ■ a)v.  Nótese  además  que  el  trivector  a no  es  una  cantidad  invariante  bajo 
transformaciones  de  Lorentz  (y  por  lo  tanto  no  es  absoluta,  a!  a),  en  contraste  con  lo  que 
dijimos  en  la  sección  2.2.  En  el  fondo  esto  es  de  esperar,  puesto  que  dos  observadores  distintos, 
que  ven  moverse  la  partícula  con  velocidades  diferentes,  deben  medir  aceleraciones  diferentes, 
si  queremos  asegurar  que  en  ningún  sistema  de  referencia  la  velocidad  de  la  partícula  puede 
superar  la  velocidad  de  la  luz. 

El  cuadrivector  momento  p1'  se  define  de  manera  análoga  (pero,  ojo,  no  igual)  al  momento 
newtoniano 

p M = mou M,  (5.33) 

donde  Too  es  la  masa  (de  reposo)  de  la  partícula.  Dado  que  m o es  un  invariante  y id1 *  un  cua- 
drivector, está  claro  que  también  p1 *'  lo  es.  De  la  definición  se  ve  que  las  componentes  espaciales 
de  p1'  corresponden  al  momento  newtoniano  con  un  factor  de  corrección  relativista  pl  = prmpu1 , 
mientras  la  componente  temporal  es  la  energía  cinética  E relativista. 


Bajo  un  boost  (3.19),  las  componentes  de  p11  transforman  como  (3.31).  La  norma  de  p1'  es  un 
invariante  y viene  dado  por 

ÍVP"  = tuq.  (5.35) 

Nótese  que  esta  expresión  no  es  más  que  la  formulación  covariante  de  (3.32).  La  masa  too  de  una 
partícula  es  un  invariante,  simplemente  porque  es  la  norma  del  cuadrivector  pN 

La  versión  relativista  de  la  segunda  ley  de  Newton  viene  dado  por 


1 dT  ’ 


(5.36) 


donde  f1'  es  el  cuadrivector  fuerza,  cuyas  componentes  espaciales  son  proporcionales  a la  fuerza 
newtoniana  F y la  componente  temporal  f°  = v ■ F al  trabajo  realizado  por  F por  unidad  de 
tiempo. 


r = 7 


v • F 
F 


(5.37) 


Obsérvese  que  en  términos  de  la  aceleración  cuadrimensional  se  puede  escribir  la  segunda  ley 
de  Newton  como 

/M  = moa'1.  (5.38) 

Sin  embargo  es  importante  darse  cuenta  de  que,  aunque  formalmente  análoga  a F = moa,  esta 
ecuación  es  tanto  conceptualmente  como  físicamente  muy  distinta  a su  homologa  newtoniana. 

De  (5.36)  podemos  ver  que  mientras  que  no  actúe  ninguna  fuerza  f/l  sobre  una  partícula  el 
cuadrivector  p1'  se  conserva.  Obsérvese  que  por  lo  tanto  la  ley  de  la  conservación  de  la  energía 
y la  ley  de  la  conservación  del  momento,  en  la  física  newtoniana  dos  leyes  independientes,  en 
realidad  corresponden  a diferentes  componentes  de  la  misma  ecuación  cuadrimensional. 

Finalmente,  la  definición  del  momento  angular  en  la  dinámica  relativista  es  un  poco  más  sutil. 
La  generalización  del  momento  angular  tridimensional  i = r x p no  es  un  cuadrivector,  sino  un 
tensor  antisimétrico,8 

= x»pv  - (5.39) 

8Esta  definición  del  momento  angular  es  general  para  cualquier  número  de  dimensiones.  El  caso  de  un  espacio  tridi- 
mensional es  especial,  porque  entonces  un  tensor  antisimétrico  es  equivalente  a un  vector,  a través  del  tensor  de  Levi- 
Civita:  ll  = £l^k  XjPk-  Nótese  que  de  este  modo  también  recuperamos  el  conocido  caso  de  que  el  momento  angular  en 
dos  dimensiones  viene  dado  por  una  sola  componente,  (es  decir:  es  un  escalar):  l = e1-7  XiPj. 
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cuyas  componentes  espaciales  nos  dan  el  familiar  momento  angular  tridimensional,  = ^£ljk£f-, 
mientras  las  componentes  L°l  = tp'  — xlE  son  una  cantidad  física  de  poca  relevancia  en  la  física 
newtoniana. 


Derivando  el  momento  angular  con  respecto  al  tiempo  propio,  obtenemos  que 


dL^ 

dr 


dx » 


-P 


t dpu  dxu 


-r 


dr  *"  dr  dr  r ' X dr 

moí/ü"  - uV)  + x^T  - xuf^, 


(5.40) 


donde  en  la  segunda  igualdad  hemos  utilizado  la  definición  (5.33)  del  momento  p1'  y la  segunda 
ley  de  Newton  (5.36).  El  primer  término  de  esta  igualdad  es  idénticamente  cero  por  la  antisi- 
metría, mientras  en  el  los  últimos  dos  términos  reconocemos  el  momento  de  fuerza  relativista, 

IkP"  = - xvf».  (5.41) 

La  ecuación  (5.40)  toma  por  lo  tanto  la  forma 

— — = M^,  (5.42) 

dr 

lo  que  implica  que  el  momento  angular  está  conservado,  mientras  el  momento  de  fuerza  es  cero. 


Por  otro  lado,  ya  hemos  dicho  en  las  secciones  2.3  y 3.3  que  las  Leyes  de  Maxwell  son  cova- 
riantes bajo  transformaciones  de  Lorentz  y no  necesitan  por  lo  tanto  una  corrección  relativista. 
Matemáticamente  esto  quiere  decir  que  los  objetos  que  aparecen  en  la  teoría  de  Maxwell  ya  com- 
binan de  manera  natural  en  cuadrivectores  y tensores. 

La  densidad  de  carga  p y la  densidad  de  corriente  j = pv  forman  las  componentes  de  un 
cuadrivector  y los  potenciales  <f>  y A combinan  en  el  cuadrivector  A11 


f = 


(5.43) 


Las  transformaciones  de  y A1'  bajo  un  boost  vienen  dadas  por  (3.37)  y (3.42). 

Los  potenciales  <j>  y A dan  lugar  a los  campos  electromagnéticos  E y B a través  de  las  identi- 
dades (3.39),  o en  componentes 

Ei  = -(dtÁ)i  - (V0)i  = -d°Ai  + dlA°, 

Bi  = Ctífc(^)¿(Í)fc  = -eijkdjAk  = -le..k(&Ak-dkAi).  (5.44) 

En  otras  palabras  podemos  definir  un  tensor  antisimétrico  F1"'  de  rango  (2, 0)9 

Fllv  = dtlAv  - d (5.45) 


cuyas  componentes  (Oí)  son  las  componentes  del  campo  eléctrico,  F0t  = —Ei,  y (ij)  las  del  cam- 
po magnético,  F 13  = —el3kBk.  El  tensor  F ^ se  llama  el  tensor  electromagnético.  Explícitamente 
tenemos  (ejerc.) 


/ 0 

- El 

— E2 

-Ez  \ 

Ei 

0 

-B3 

b2 

£-2 

b3 

0 

—Bi 

V If 

-b2 

Si 

° / 

(5.46) 


9E1  correspodiente  tensor  F de  rango  (0,  2)  se  define  simplemente  bajando  los  índices  a través  de  la  métrica: 
F,j, „ = Piíprlv\Fp>'.  Ojo,  el  signo  de  algunas  de  las  componentes  de  F será  diferente  que  el  de  las  componentes 
correspondientes  de  Fpv . 
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Dejamos  como  ejercicio  averiguar  que  la  transformación  de  Fpv  bajo  las  transformaciones  de 
Lorentz  f = Ap  PAV \FpX  recupera  las  transformaciones  (3.38)  bajo  el  boost  (5.21). 

Con  los  vectores  jp  y A1'  y el  tensor  F1"'  tenemos  todos  los  ingredientes  para  formular  la 
teoría  de  Maxwell  en  su  versión  covariante.  Las  leyes  homogéneas  de  Maxwell  (3.33b)  y (3.34a) 
se  pueden  escribir  en  función  del  tensor  F,íl'  como 

(V)iSi  = ^éjkdiFjk  = 0, 

eijk(y)jEk  + dtBi  = ~^eijk  (djFk0  + dkF°i  + d°F^  = 0.  (5.47) 

Aunque  a primera  vista  estas  dos  ecuaciones  parecen  muy  diferentes,  se  trata  en  realidad  de  la 
componente  temporal  y las  componentes  espaciales  de  la  misma  ecuación  cuadrimensional.  Esto 
se  ve  al  darse  cuenta  que  la  relación  entre  el  tensor  de  Levi-Civita  tri-  y cuadrimensional  viene 
dada  por  e°bfc  = e*J  . Las  dos  ecuaciones  (5.47)  se  pueden  por  lo  tanto  resumir  en 

epvpxdvFpX  = 0,  (5.48) 

o equivalentemente 

dvFpx  + dx  Fvp  + dpFXv  = 0.  (5.49) 

La  ecuación  (5.48)  ó (5.49)  se  llama  la  identidad  de  Bianchi  y la  solución  de  esta  ecuación  viene  dada 
por  (5.45)  (ejerc.).  En  otras  palabras,  la  identidad  de  Bianchi  (o  equivalentemente  las  ecuaciones 
homogéneas  de  Maxwell)  nos  dice  que  se  puede  escribir  Fpi/  como  la  derivada  antisimetrizada 
de  un  potencial  Ap,  tal  como  dice  (5.45). 

En  realidad  hay  muchos  potenciales  que  dan  el  mismo  Fpl, : dado  un  potencial  Ap  que  general 
una  Fpv  a través  de  (5.45),  el  potencial  A'p  relacionado  con  Ap  a través  de 

A’p  = AP  + dpA,  (5.50) 

con  A una  función  arbitraria,  también  genera  la  misma  expresión  para  Fpl, . Esta  ambigüedad  de 
los  potenciales  A1'  es  obviamente  la  traducción  a lenguaje  cuadrimensional  de  las  transforma- 
ciones gauge  (1.50),  y nos  está  diciendo  es  que  los  A1'  no  son  más  que  unos  campos  auxiliares, 
mientras  que  la  física  real  está  en  el  tensor  electromagnético  FpV.  Hasta  cierto  punto  el  rol  de  la 
invariancia  gauge  en  la  física  de  partículas  es  comparable  con  el  rol  de  la  invariancia  bajo  trans- 
formaciones de  coordenadas  en  la  teoría  de  la  relatividad.  En  las  matemáticas  se  han  encontrado 
profundas  relaciones  entre  estos  dos  principios  en  la  teoría  de  fibrados. 

Las  ecuaciones  de  Maxwell  que  nos  quedan,  las  inhomogéneas  (3.33a)  y (3.34b)  también  se 
pueden  escribir  en  función  de  objetos  covariantes.  Un  pequeño  cálculo  muestra  que  estas  dos 
ecuaciones  dan  respectivamente  (ejerc.) 

djFj0  = j° 

djFji  + d0F0i  = j\  (5.51) 

también  aquí  resulta  que  las  dos  ecuaciones  corresponden  a la  componente  temporal  y las  com- 
ponentes espaciales  de  la  misma  ecuación  cuadrimensional.  Para  ver  esto,  no  hace  falta  mas  que 
añadir  a la  primera  ecuación  el  término  SqF00,  que  es  idénticamente  cero  por  la  antisimetría  de 
Fp,/ . Por  lo  tanto  las  ecuaciones  inhomogéneas  se  combinan  en 

dpF^=f.  (5.52) 

Vemos  por  lo  tanto  que  hemos  resumido  las  cuatro  ecuaciones  de  Maxwell  (3.33a)  y (3.34b)  en 
dos,  siendo  (5.48)  y (5.52).  Por  su  estructura  de  índices  está  claro  que  las  dos  son  ecuaciones 
vectoriales10  y transforman  como  un  cuadrivector  bajo  las  transformaciones  de  Lorentz  (ejerc.), 
como  ya  habiamos  visto  en  el  Capítulo  3. 

10La  identidad  de  Bianchi  es  un  tensor  de  rango  (0,3)  en  su  formulación  (5.49). 
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De  la  ecuación  inhomogénea  de  Maxwell  podemos  derivar  directamente  otra  relación  impor- 
tante, tomando  la  divergencia  de  (5.52),  es  decir  actuando  con  la  derivada  dv.  El  lado  izquierdo 
entonces  es  cero,  por  la  combinación  de  la  simetría  de  las  derivadas  y la  antisimetría  de  F1'" , de 
modo  que  obtenemos 

d.r  = 0.  (5.53) 

Esto  es  la  ley  de  conservación  de  carga,  que  hemos  visto  en  notación  tridimensional  en  (3.36). 
Nótese  que  esta  ecuación  tiene  la  estructura  del  producto  escalar  entre  entre  <9;,  y j1'  y por  lo 
tanto  es  invariante  bajo  las  transformaciones  de  Lorentz.  La  conservación  de  la  carga  es  por  lo 
tanto  un  hecho  que  no  depende  de  un  observador,  sino  que  es  válido  para  todos  los  observadores 
(inerciales). 

También  podemos  recuperar  las  ecuaciones  inhomogéneas  de  ondas  (3.40)  que  satisfacen  los 
potenciales,  sustituyendo  la  expresión  (5.45)  en  (5.52).  Asumiendo  que  los  potenciales  satisfacen 
el  gauge  de  Lorenz  (3.41) 

d.A'1  = 0,  (5.54) 

vemos  que  (5.52)  se  reduce  a la  versión  covariante  de  las  ecuaciones  (3.40) 

dl,&lAv  = f.  (5.55) 

Finalmente  es  útil  observar  que  se  puede  derivar  toda  la  dimámica  mencionada  en  esta  sección 
a través  del  formalismo  lagrangiano  de  la  acción  de  la  partícula  cargada  y para  el  campo  electro- 
magnético (ejerc.) 


^partícula 


^Maxwell 


J dr  r/^x^x1'  - q j dr  A^ (x(t)), 
d4x  FM¡y(x)FMl/ (x)  - J d^xj^A^. 


(5.56) 


Es  muy  instructivo  averiguar  que  estas  acciones  son  precisamente  las  acciones  (1.60)  y (1.63)  en 
lenguaje  convariante  (aunque  la  primera  con  las  necesarias  correcciones  relativistas  para  que  sea 
invariante  Lorentz)  y por  lo  tanto  toda  la  física  comentada  en  la  sección  1.5  (variables  dinámicas, 
invariancia  gauge,  etc)  aplica  de  la  misma  manera  a estas  acciones  (ejerc.). 


5.4.  La  necesidad  de  la  relatividad  general 


Ya  en  1907,  sólo  dos  años  después  de  la  publicación  de  la  relatividad  especial,  Einstein  se 
dió  cuenta  de  que  la  teoría  de  la  gravedad  newtoniana  y la  relatividad  especial  son  mutuamente 
incompatibles  (salvo  en  el  caso  de  un  campo  gravita  torio  constante  y estático).  Hay  varias  mane- 
ras, matemáticas  y físicas,  de  ver  esto. 

Matemáticamente,  se  ve  porque  la  gravedad  newtoniana  no  es  invariante  bajo  el  grupo  de 
Lorentz.  Según  Newton,  una  partícula  en  un  campo  gravitatorio  está  sometida  a una  aceleración 


d2x 

~d£I 


= -V$, 


(5.57) 


causado  por  la  fuerza  gravitatoria,  cuyo  potencial  <1>  está  relacionado  con  la  densidad  de  materia 
pm  en  el  universo  a través  de  la  ecuación  de  Poisson 


A<f>  = AttGnpm,  (5.58) 

donde  Gn  es  la  constante  de  Newton.  Obviamente,  ni  (5.57),  ni  (5.58)  transforman  bien  bajo  una 
transformación  de  Lorentz. 
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Primero,  tanto  el  lado  izquierdo  como  el  derecho  de  (5.57)  son  vectores  tridimensionales  y no 
cuadrimensionales.  Además,  la  aceleración  está  definida  como  la  segunda  derivada  de  la  posi- 
ción con  respecto  al  tiempo,  pero  no  está  claro  con  respecto  al  tiempo  de  qué  observador.  Para 
Newton  esto  no  era  ningún  problema,  puesto  que  para  él  existe  un  sólo  tiempo  absoluto,  igual 
para  todos  los  observadores.  Sin  embargo  de  la  teoría  de  la  relatividad  especial  sabemos  que  cada 
observador  tiene  su  propio  tiempo  propio. 

Se  podría  intentar  remediar  estos  problemas,  derivando  con  respecto  al  tiempo  propio  e in- 
tentando convertir  (5.57)  en  una  ecuación  covariante,  como  acabamos  de  hacer  con  la  mecánica 
newtoniana.  Pero  un  problema  más  gordo  nos  supone  la  otra  parte  de  la  teoría  de  la  gravedad 
newtoniana,  la  ecuación  (5.58).  Aquí  aparece  el  laplaciano  A<f>,  en  lugar  del  operador  invariante, 
el  d'alambertiano  □ $.  Para  apreciar  las  dificultades  que  supone  este  operador  en  lugar  del  otro, 
pasaremos  a los  argumentos  físicos  de  la  incompatibilidad. 

La  ecuación  (5.58)  dice  que  el  potencial  gravitatorio  $ en  un  punto  x está  determinado  por  la 
distribución  de  materia  pm  en  el  universo.  Si  por  lo  tanto  un  observador  cambia  la  distribución 
de  materia  en  cierto  punto,  el  efecto  en  el  potencial  gravitatorio  se  nota  inmediatamente  en  todo 
el  universo.  En  otras  palabras,  la  fuerza  gravitatoria  se  propaga  en  la  teoría  de  Newton  con  una 
velocidad  infinita.11 

No  sólo  velocidades  mayores  que  la  velocidad  de  la  luz  son  problemáticas  en  la  relatividad 
especial,  también  surge  una  pregunta  básica:  Si  el  cambio  de  la  distribución  de  materia  en  un 
punto  y el  cambio  del  potencial  en  otro  punto  son  simultáneos,  ya  que  el  efecto  se  nota  de  ma- 
nera inmediato,  ¿son  simultáneos  para  qué  observador?  Hemos  visto  en  el  Capítulo  3 que  la 
simultaneidad  de  sucesos  es  algo  que  no  está  bien  definido,  sino  que  depende  del  observador. 
Si  la  gravedad  newtoniana  tiene  que  recurrir  a un  observador  especial,  por  el  cual  las  fórmulas 
(5.57)  y (5.58)  son  válidas,  viola  el  Principio  de  la  Relatividad. 

El  verdadero  problema  de  la  ecuación  de  Poisson  (5.58)  es,  que  es  válida  para  el  caso  estático, 
cuando  la  distribución  de  materia  no  varía.  En  este  sentido,  (5.58)  es  el  análogo  gravitacional  de 
la  ley  de  Gauss  V • E = pe  en  electrostática,  cuando  la  distibución  de  cargas  eléctricas  es  constante 
en  el  tiempo.  En  este  caso  podemos  elegir  el  gauge  de  Coulomb,  V • A = 0,  de  modo  que  se  puede 
escribir  la  ecuación  de  Gauss  completamente  en  términos  del  potencial  eléctrico  <j>, 

A <¡>  = -pe.  (5.59) 

Sin  embargo,  esta  descripción  es  insuficiente  en  el  caso  de  fuentes  no-estáticas:  los  campos  mag- 
néticos B que  aparecen  en  ese  caso  nos  obligan  a introducir  un  potencial  vectorial  A,  cuya  dinámi- 
ca, igual  que  la  de  <\>,  está  descrita  por  una  ecuación  de  onda.  Las  soluciones  de  ésta  son  los 
conocidos  potenciales  retardados,  que  describen  la  propagación  con  velocidad  finita  de  las  per- 
turbaciones, compatibles  con  la  causalidad  relativista.  En  otras  palabras,  covariancia  Lorentz  e 
invariancia  gauge  nos  dicen  que  la  generalización  de  la  ley  de  Gauss  (5.59)  al  caso  no-estático  es 
directamente  la  teoría  de  Maxwell  entera. 

En  1907  Einstein  se  vió  confrontado  con  el  equivalente  gravitacional:  encontrar  la  teoría  dinámi- 
ca de  la  gravedad,  que  sea  compatible  con  las  exigencias  básicas  de  la  relatividad  especial  (en  par- 
ticular, la  propagación  a velocidad  finita)  y cuyo  caso  estático  sea  la  ecuación  de  Poisson  (5.58). 
Si  es  paso  de  electrostática  a la  teoría  de  Maxwell  es  grande,  el  de  la  gravedad  newtoniana  a la 
relatividad  general  lo  es  más  aún  y a Einstein  le  costó  mucho  remediar  este  problema.  Aunque 
ya  se  dió  cuenta  en  1907  de  la  incompatibilidad  de  ambas  teorías  y de  la  solución,  el  Principio  de 
Equivalencia,  tardó  hasta  1911  para  llegar  a una  primera  formulación  matemática  y otros  2 años 
más,  hasta  1913,  para  el  Principio  de  Covariancia.  Y no  fue  hasta  1915,  diez  años  después  de  la 
relatividad  especial,  cuando  vino  con  una  versión  definitiva  de  la  relatividad  general. 

El  problema  que  surge  al  intentar  incorporar  la  gravedad  es  que  tenemos  que  tratar  con  obser- 

11Nótese  que  esto  no  pasaría  si  el  operador  diferencial  fuera  un  d'alambertiano:  las  soluciones  en  este  caso  son  funcio- 
nes del  tipo  f(t  ± x),  los  conocidos  potenciales  retardados  y avanzados. 
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vadores  acelerados  y por  lo  tanto  no-inerciales  (o  por  lo  menos  tenemos  que  tratar  con  observa- 
dores que  no  pertenecen  a la  misma  clase  inercial,  los  cuales  la  relatividad  especial  simplemente 
no  considera.  La  solución  al  problema  consiste  básicamente  en  un  viejo  truco  de  la  mecánica 
clásica:  la  introducción  de  fuerzas  ficticias. 

En  la  mecánica  newtoniana  un  sistema  inercial  está  definido  como  un  sistema  en  el  cual  la 
Segunda  Ley  de  Newton,  F = mu,  es  válida,  es  decir  un  sistema  en  el  que  cada  aceleración  a de 
una  partícula  está  debida  a una  fuerza  F que  actúa  sobre  la  partícula.  En  sistemas  no-inerciales 
por  otro  lado,  las  partículas  libres  no  seguirán  trayectorias  rectas  con  respecto  a este  sistema, 
debido  a la  aceleración  de  este  mismo.  Sin  embargo,  por  razones  prácticas  un  observador  no- 
inercial  puede  auto-engañarse  y creerse  inercial,  siempre  y cuando  asuma  la  existencia  de  fuerzas 
ficticias  / que  se  crean  responsables  de  las  aceleraciones  no-inerciales  an  ¡ observadas,  de  modo 
que  la  Segunda  Ley  de  Newton  vuelva  a ser  válida  otra  vez: 

F + f = m(a  + an.i. ) ■ (5.60) 

Ejemplos  conocidos  de  la  mecánica  newtoniana  son  la  fuerza  de  Coriolis  y la  fuerza  centrífuga. 

Lo  que  hizo  Einstein  en  realidad  era  darse  cuenta  de  que  partículas  en  caída  libre  son  (local- 
mente) equivalentes  a partículas  libres  en  un  sistema  inercial,  sobre  las  cuales  no  actúa  ninguna 
fuerza  y que  por  lo  tanto  podía  considerar  la  gravedad  como  una  fuerza  ficticia.  Esto  es  un  paso 
altamente  no-trivial  y sólo  es  posible  gracias  a que  todos  los  objetos  caen  con  la  misma  velocidad, 
independientemente  de  su  masa.  No  es  ninguna  coincidencia  que  en  (5.60)  la  masa  (gravitatoria) 
delante  de  la  aceleración  gravitatoria  a sea  la  misma  masa  que  la  masa  (inercial)  delante  de  la 
aceleración  no-inercial  an.¡..  Esto  se  llama  el  Principio  de  Equivalencia  y lo  discutiremos  en  más 
detalle  en  el  Capítulo  8. 

Una  de  las  peculiaridades  del  Principio  de  Equivalencia  es  que  es  solamente  válido  local- 
mente, es  decir  a escalas  pequeñas,  debido  a las  inhomogeneidades  de  un  campo  gravitatorio 
genérico.  Dos  observadores  en  caída  libre,  uno  encima  del  polo  norte  y otro  encima  del  ecuador, 
se  verán  mutuamente  acelerados,  ya  que  siguen  trayectorias  ortogonales  hacia  el  centro  del  la 
Tierra.  Aunque  cada  uno  se  puede  considerar  a sí  mismo  como  un  observador  inercial,  no  existe 
ningún  sistema  que  contenga  a los  dos  observadores  a la  vez  como  inerciales.  El  sistema  inercial 
que  asume  cada  observador  tiene  una  extensión  finita  y pequeña. 

Esta  observación  tiene  una  consecuencia  profunda:  implica  que  se  puede  considerar  un  espa- 
ciotiempo  con  gravedad  como  un  conjunto  de  pequeños  trozos  de  espaciotiempo  plano  (Min- 
kowski),  pero  no  hay  un  sistema  inercial  global.  La  unión  de  todos  los  trochos  de  espacios  planos 
"pegados  y cosidos"  forma  un  espacio  que  globalmente  no  es  plano,  sino  que  tiene  curvatura.  En 
realidad,  lo  que  consiguió  Einstein  con  la  relatividad  general  era  interpretar  la  gravedad  como 
una  fuerza  ficticia,  en  realidad  debida  a la  geometría  curva  del  espaciotiempo.  Las  trayectorias 
de  partículas  aceleradas  por  la  gravedad  no  son  más  que  el  análogo  de  líneas  rectas  (trayectorias 
de  partículas  libres)  en  un  espacio  curvo. 

Matemáticamente,  una  cosa  que  globalmente  es  un  espacio  con  curvatura,  pero  localmente 
tiene  el  aspecto  de  un  espacio  plano,  se  llama  una  variedad  y la  herramienta  matemática  que 
permite  hacer  álgebra  y análisis  en  un  espacio  curvo  es  la  geometría  diferencial,  una  generalización 
de  la  geometría  plana  de  Euclides.  De  la  discusión  arriba  está  claro  que  la  geometría  diferencial 
es  una  herramienta  indispensable  para  estudiar  la  Relatividad  General,  de  modo  que  en  la  Parte 
II  la  estudiaremos  en  más  detalle. 
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Parte  II 

Geometría  Diferencial 
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Capítulo  6 

Variedades  y cambios  de 
coordenadas  generales 


No  te  preocupes  por  tus  problemas  con  las  matemáticas;  te  aseguro  que  los  mios  son 
mucho  mayores. 

(A.  Einstein,  1943,  en  una  carta  a una  niña  de  9 años) 


Hasta  ahora  nos  hemos  limitado  en  hacer  solamente  transformaciones  lineales,  y incluso  ma- 
yoritariamente  ortogonales,  que  nos  llevaban  de  un  sistema  de  coordenadas  cartesianas  a otro 
(tanto  en  Rw  como  en  R1,3).  Pero  también  existen  transformaciones  más  generales  en  M.N  que 
no  tienen  esta  propiedad  e incluso  existen  espacios  más  generales  donde  ni  siquiera  se  puede 
definir  un  sistema  de  coordenadas  cartesianas  en  todo  el  espacio.  Estas  transformaciones  y estos 
espacios  son  tanto  físicamente  como  matemáticamente  nada  exóticos.  Basta  considerar  un  cam- 
bio de  coordenadas  entre  coordenadas  cartesianas  esféricas  o considerar  espacios  como  la  esfera 
bidimesional.  En  este  capítulo  generalizaremos  las  operaciones  del  Capítulo  4 a cambios  de  coor- 
denadas arbitrarias  e investigaremos  las  consecuencias  que  tiene  esto  sobre  vectores  y tensores. 


6.1.  Repaso  de  coordenadas  curvilíneas  en  RN 

Antes  de  empezar  a estudiar  cambio  de  coordenadas  en  espacios  generales,  repasaremos  pri- 
mero algo  más  familiar:  la  descripción  de  en  coordenadas  curvilíneas.  Ejemplos  conocidos  en 
M3  son  las  coordenadas  esféricas 


x = r sin  9 eos  ip, 

y = r sin  9 sin  ip, 

z = reos  6. 

(6.1) 

o las  coordenadas  cilindricas 

x = pcosip, 

y = p sin  tp, 

z = z. 

(6.2) 

Es  importante  darse  cuenta  que,  aunque  en  coordenadas  curvilíneas  las  expresiones  de  la  métrica, 
el  producto  escalar,  etc  pueden  tener  un  aspecto  muy  diferente  que  en  coordenadas  cartesianas, 
sólo  hemos  hecho  un  cambio  de  coordenadas  y por  lo  tanto  toda  las  propiedades  geométricas  del 
espacio  son  aún  las  de  HtN . 

Considaremos  ahora  N funciones  inversibles  yM( x1)  de  las  coordenadas  cartesianas  xl . El  he- 
cho de  que  las  funciones  y^lx1)  sean  inversibles  implica  que  a cada  punto  de  R v se  le  puede 
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asignar  un  único  valor  de  yp  y que  cada  valor  de  y1'  corresponde  con  un  solo  punto  de  M.N . Las 
funciones  y1'  sirven  por  lo  tanto  igual  de  bien  como  coordenadas  sobre  Rw  que  las  coordenadas 
cartesianas  x L1  La  transformación 

y M = z/V)  (6.3) 

se  llama  una  transformación  general  de  coordenadas.  La  gran  diferencia  entre  una  transformación 
(6.3)  y la  transformación  (4.5)  es  que  en  (6.3)  las  reglas  de  transformación  varian  de  punto  un 
punto,  mientras  en  (4.5)  son  las  mismas  para  todo  R^.  El  cambio  de  coordenadas  (4.5)  se  llama 
una  transformación  global  y (6.3)  una  transformación  local. 

Igual  que  en  el  sistema  cartesiano,  podemos  definir  una  base  {|eM)}  para  las  coordenadas 
curvilíneas.  Un  vector  contravariante  \ V ),  que  en  una  base  cartesiana  { |e¿)}  se  descompone  como 
\V)  = V'\e,),  tendrá  en  coordenadas  curvilíneas  la  forma  V)  = l//' |e;,),  donde  los  e;í)  son  los 
vectores  de  base  (no  necesariamente  ortogonales  o normalizados).  Descomponiendo  los  vectores 
de  base  |eM)  en  la  base  {|e¿)}  obtenemos  que 


,)  = 


d\r) 

dyp 


dxl 

dya 


I e¿). 


(6.4) 


Por  un  argumento  idéntico  al  de  la  sección  4,  es  fácil  de  averiguar  que  entonces  las  componentes 
de  | V)  en  las  distintas  coordenadas  están  relacionadas  como 


V»  = % V\ 

dxl 


(6.5) 


Obsérvese  que  las  reglas  de  transformación  entre  la  base  cartesiana  y la  curvilínea  depende  del 
punto  p en  Jbv  en  que  se  haga  la  transformación,  debido  al  carácter  local  de  la  transformación 
(6.3).  Esto  implica  que,  en  contraste  con  el  sistema  cartesiano,  una  dirección  ¡ef)  varía  de  punto  en 
punto.  Por  ejemplo,  la  dirección  radial  |er)  en  coordenadas  polares  es  distinta  en  puntos  distintos. 
Esto  tendrá  consecuencias  importantes,  como  veremos  en  seguida. 

También  los  vectores  covariantes  se  pueden  descomponer  en  una  base  de  coordenadas  cur- 
vilineas  {W\  = Wít(eM|,  donde  los  vectores  de  la  base  dual  actúan  sobre  los  vectores  de  la  base 
{|eM)}  como 

(eM|e„)  = S^v  (6.6) 

Para  mantener  esta  relación  bajo  cambios  de  coordenadas  es  preciso  que  los  vectores  de  la  base 
dual  y las  componentes  de  los  vectores  covariantes  transforman  como 


s/*|  = 

dxl 


dri 

V^  = d^  Vi' 


(6.7) 


A través  de  las  reglas  de  transformación  (6.4)  y (6.7)  podemos  encontrar  una  expresión  para  la 
métrica  en  coordenadas  curvilineas.  Aplicando  los  cambios  de  coordenadas  a (4.21)  obtenemos 
que 


dxJ 


(6.8) 


y multiplicando  esta  ecuación  con  dxl/dyp  encontramos  que 


dxl  dxi 
dyp  dy v 


(6.9) 


Comparando  esta  relación  con  (4.21)  sugiere  que  interpretamos  los  factores  delante  de  (ep|  como 
la  métrica  de  Rw  en  coordenadas  curvilineas: 


dxl  dxj  x 
9fíV  = d^drij- 


(6.10) 


'Para  evitar  confusión  utilizamos  índices  latinos  (i,j,k,...)  para  las  coordenadas  cartesianas  y indices  griegos 
(/r,  v,  p, ...)  para  las  coordenadas  curvilíneas. 
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Observa  que  esta  relación  también  nos  da  directamente  las  reglas  de  transformación  de  la  métrica. 
Es  un  ejercicio  instructivo  comprobar  que  una  manera  alternativa  de  encontrar  la  forma  de  la 
métrica  en  coordenadas  curvilineas  es  el  equivalente  de  (4.29),  es  decir  tomando  el  producto 
escalar  entre  los  vectores  |eM): 

9nv  = M • \ev).  (6.11) 

Por  ejemplo,  un  pequeño  ejercicio  muestra  que  la  métrica  de  R3  en  coordenadas  cilindricas  y 
esféricas  vienen  dadas  por 

ds2a  = dr 2 + r2d(p 2 + dz2, 

ds2esi  = dr2  + r2dd2  + r2  sin2  9d<p2.  (6.12) 

Es  importante  darse  cuenta  que,  aunque  la  expresión  de  la  métrica  en  coordenadas  curvilineas 
es  muy  distinta  a la  en  coordenadas  cartesianas,  sólo  hemos  hecho  un  cambio  de  coordenadas.  El 
espacio  que  describe  gllv  es  todavia  RA'  con  las  mismas  propiedades  geométricas  que  en  coorde- 
nadas cartesianas. 

La  métrica  gllv  juega  el  mismo  papel  que  la  métrica  euclídea  cartesiana  Sl;i . En  particular,  la 
métrica  y su  inversa  suben  y bajan  los  índices  de  vectores  co-  y contravariantes 

Vtl  = g,ÍVVv,  V " = gpvVv,  (6.13) 

y el  producto  escalar  de  dos  vectores  en  coordenadas  curvilíneas  está  definida  como 

(V\W)  = = g^v^wr  (6.14) 


Las  operaciones  diferenciales  son  un  poco  más  sutiles  en  coordenadas  curvilíneas  que  en 
coordenadas  cartesianas.  Donde  en  coordenadas  cartesianas  la  derivada  de  un  campo  vectorial 
es  simplemente  la  derivada  de  cada  componente 


m.  = wL\e.s 

dxl  dxl  3 


(6.15) 


en  coordenadas  curvilíneas  el  operador  diferencial  también  actúa  sobre  los  vectores  de  base  e/t, 
puesto  que  estos  cambian  de  punto  en  punto.  Por  lo  tanto  la  derivada  de  un  vector  V está  dada 
por 

W = dliVv\ev)  +V,,dli\ev)  = (d^V» + \ep).  (6.16) 

En  la  última  igualdad  hemos  definido  la  conexión  de  Levi-Civita  (o  los  símbolos  de  Christoffel) 
como 

9M=r^\ep),  (6.17) 

o sea,  es  el  componente  p del  vector  dp\ev)  en  la  base  {|ep)}.  El  objeto 


VltVp  = dltVl,  + T^/Vv 


(6.18) 


es  la  derivada  covariante  de  Vp  y veremos  que  tiene  la  propiedad  que  transforma  como  un  tensor 
de  rango  2 bajo  cambio  de  coordenadas.  Aunque  no  es  obvio  de  la  definición  (6.17),  la  conexión 
de  Levi-Civita  es  simétrica  en  los  índices  /;  y v (ejerc.)  y se  puede  expresar  en  función  de  la 
métrica  como  (ejerc.) 

= \gpX  {da9\v  + dugpX  - d\ . (6.19) 

Es  fácil  de  comprobar  que  la  conexión  de  Levi-Civita  es  cero  en  coordenadas  cartesianas,  pero  no 
lo  es  en  coordenadas  esféricas  o cilindricas.  Utilizando  estas  definiciones  de  derivadas  en  coor- 
denadas curvilíneas  se  puede  obtener  las  expresiones  conocidas  del  gradiente,  la  divergencia,  el 
rotacional  y el  laplaciano  en  coordenadas  esféricas  y cilindricas.  Para  su  expresión  referimos  la 
literatura  y para  una  discusión  más  elaborada  sobre  estos  operadores  en  coordenadas  arbitrarias 
al  Capítulo  7. 
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Figura  6.1:  Mapas  y cambios  de  coordenadas  en  una  variedad:  un  mapa  es  un  parche  U de  una  variedad 
N -dimensional  MN  equipada  con  una  transformación  f : U — > 1^  que  induce  un  sistema  de  coordenadas 
en  el  mapa  (flechas  sólidas).  Si  dos  mapas  se  solapan,  los  sistemas  de  coordenadas  inducidas  son  tales  que 
existe  un  cambio  de  coordenadas  de  un  sistema  al  otro  (las  flechas  interrumpidas). 


6.2.  Variedades 


Hemos  visto  en  la  sección  5.4  que  la  física  de  la  relatividad  general  sugiere  que  el  espa- 
cio(tiempo)  parece  plano  (Minkowski)  a escalas  pequeñas,  pero  globalmente  no  se  puede  des- 
cribir con  un  sistema  de  coordenadas  cartesianas.  Matemáticamente  el  objecto  que  tiene  esta  pro- 
piedad es  una  variedad  (en  inglés  manifold). 

En  grandes  líneas  se  puede  decir  que  una  variedad  iV-dimensional  A4X  es  un  espacio  que 
localmente  tiene  el  aspecto  de  M.N . Una  variedad  se  llama  riemanniana  si  la  métrica  es  definida 
positiva  y lorentziana  si  tiene  una  métrica  con  signatura  (-| ...  — ). 

Con  que  MN  tenga  localmente  el  aspecto  de  M.N  queremos  decir  que  en  cada  punto  existe 
una  transformación  <f>  que  mapea  una  parte  U C MN  a (véase  figura  6.1).  Las  coordenadas 
(no  necesariamente  cartesianas)  en  RjV  inducen  coordenadas  locales  en  A4  Y a través  de  la 
transformación  inversa  </>-1.  Una  parte  U de  M.N  con  un  sistema  de  coordenadas  inducidas  se 
llama  un  mapa.  De  manera  práctica  se  puede  por  lo  tanto  pensar  en  un  mapa  como  una  parte  del 
espacio  equipado  con  un  sistema  de  coordenadas. 

En  general  no  será  posible  cubrir  una  variedad  entera  con  sólo  un  mapa.  R^  es  un  ejemplo 
trivial  de  una  variedad  que  se  puede  cubrir  con  un  solo  mapa  (en  este  caso  la  transformación  <j> 
es  la  unidad).  Pero  es  imposible  cubrir  por  ejemplo  la  esfera  bidimensional  §2  con  un  solo  mapa. 
Este  es  el  famoso  Problema  de  los  Cartógrafos:  no  existe  una  proyección  tal  que  la  Tierra  entera 
aparece  en  un  solo  mapa  plano.  Por  ejemplo,  una  proyección  estereográfica  desde  el  polo  norte 
proyecta  todos  los  puntos  de  §2  en  el  plano  IR2,  salvo  el  mismo  polo  norte.  Este  sí  se  puede  incluir 
si  se  hace  la  proyección  estereográfica  desde  el  polo  sur,  pero  entonces  no  aparece  este  último. 
Para  cubrir  la  2-esfera  completa  hace  falta  un  mímino  de  dos  mapas. 

Si  dos  mapas  Ua  y Í7&  se  solapan  en  una  región,  las  transformaciones  inversas  f~l  y (¡y  1 
inducen  dos  sistemas  de  coordenadas  x1'  y ya  en  los  respectivos  parches.  En  la  región  donde  los 
parches  se  solapan,  las  transformaciones  </>0  y <j>b  (y  por  lo  tanto  las  coordenadas  inducidas)  tienen 
que  ser  tales  que  existe  en  la  región  de  solapamiento  una  transformación  'T  = faoff1  Y su  inversa 
que  relacionan  las  coordenadas  x/l  y y°  de  cada  mapa  (véase  figura  6.1).  En  otras  palabras,  en  la 
región  de  solapamiento  tiene  que  existir  un  cambio  de  coordenadas  que  nos  permite  relacionar 
expresiones  escritas  en  un  sistema  de  coordenadas  con  expresiones  en  el  otro  sistema.  De  esto 
modo  las  distintas  "versiones  locales  de  Rw"  de  la  variedad  están  "pegados"  de  manera  continua. 
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Un  conjunto  de  mapas  que  tiene  esta  propiedad  y además  cubre  todo  la  variedad  se  llama  un 
atlas. 

Después  de  haber  introducido  el  concepto  de  variedad  en  una  manera  un  tanto  peatonal,2  va- 
mos a estudiar  las  propiedades  geométricas  de  estas  variedades.  En  particular  estaremos  intere- 
sados en  aquellas  propiedades  que  no  son  válidas  sólo  en  un  sistema  particular  de  coordenadas, 
sino  en  todas.  Pero  ya  sabemos  de  Capítulo  4 que  los  objetos  que  tenemos  que  utilizar  entonces 
para  describir  estas  propiedades  son  los  que  transforman  bien  bajo  cambios  de  coordenadas,  es 
decir:  escalares,  tensores  y vectores. 


6.3.  Álgebra  tensorial  en  variedades 


En  la  sección  6.1  hemos  introducido  los  cambios  generales  de  coordenadas  en  RA'  y obte- 
nido una  forma  para  la  métrica,  el  producto  escalar  y incluso  hemos  introducido  brevemente 
el  operador  diferencial  y indicado  las  sutilezas  que  aparecen  con  este  operador  bajo  cambios  de 
coordenadas  generales.  Sin  embargo,  mientras  sólo  estábamos  haciendo  cambios  de  coordenadas 
en  RjV,  la  métrica  gj¡v  satisface  unas  ligaduras  específicas:  existen  unas  funciones  x1  (y1'  j tal  que 
la  métrica  se  reduce  a la  métrica  euclídea  en  coordenadas  cartesianas  <5¿;  a través  de  la  expresión 
(6.10). 

En  general  en  un  variedad  arbitraria  M N no  existirá  un  cambio  de  coordenadas  de  esta  forma. 
Por  ejemplo,  es  imposible  encontrar  un  cambio  de  coordenadas  tal  que  la  métrica  de  la  2-esfera 

§2, 

ds2  = ño  ( d9 2 + sin2  6>d<p2)  (6.20) 

o del  hiperboloide  bidimensional  H2, 

ds2  = ñ^  (dy2  + sinh2  yd£2^  (6-21) 

reduzcan  a la  métrica  plana  en  todo  la  variedad.  §2  y H2  aparentemente  tienen  propiedades 
intrínsecas  (i.e.  que  no  dependen  del  sistema  de  coordenadas  usado)  distintas  de  Rw.  En  el 
Capítulo  7 estudiaremos  estas  propiedades  en  detalle,  pero  primero  tenemos  que  mirar  cómo 
se  comportan  vectores  y tensores  bajo  cambios  generales  de  coordenadas  en  variedades  arbi- 
trarias, o sea  en  espacios  que  no  son  necesariamente  Rw.  En  realidad,  en  la  sección  anterior  no 
hemos  utilizado  en  ningún  momento  el  hecho  de  que  la  métrica  sea  reducible  o no  a la  cartesiana, 
de  modo  que  todas  las  propiedades  derivadas  en  la  sección  6.1  (salvo  precisamente  la  ecuación 
(6.10))  serán  directamente  generalizables  a .A/í N . 

Supongamos  por  lo  tanto  que  en  una  variedad  A’-dimensional  MN  tenemos  dos  sistemas  de 
coordenadas  xJ‘  y ya  (donde  utilizamos  los  índices  griegos  del  principio  del  alfabeto  para  unos  y 
los  del  medio  del  alfabeto  para  otros),  que  están  relacionadas  a través  de  un  cambio  general  de 
coordenadas  del  tipo  (6.3): 


ya  = ya(x **)  x»  = x^(ya).  (6.22) 

En  contraste  con  el  caso  de  una  transformación  global,  las  coordenadas  x1'  e ya  no  transforman 
como  vectores  bajo  una  transformación  local.  Efectivamente,  el  cambio  de  coordenadas  (6.22)  no 
es  de  la  forma  (4.5).  Sin  embargo,  sus  diferenciales 

dr*1 

dya  = T^-dxlí,  dx " = — dya  (6.23) 


2Para  una  definición  matemática  más  rigurosa  referimos  a R.  Wald,  General  Relativity  (1984)  y M.  Nakahara,  Geome- 
try,  Topology  and  Physics  (2003). 
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Tq(M) 

Figura  6.2:  El  espacio  tangente:  el  conjunto  de  todos  los  vectores  en  el  punto  p forma  el  espacio  tangente 
TP{M ) en  p.  El  conjunto  de  los  espacios  tangentes  en  todos  los  puntos  de  la  variedad  se  llama  el  haz 
tangente  T(M). 


sí  transforman  como  vectores,  si  identificamos  las  matrices  de  la  transformación  con  las  derivadas 
parciales 

dya 

(6-24) 

Observa  que  las  entradas  de  la  matriz  no  son  constantes,  sino  funciones  de  xJl , por  el 
carácter  local  de  la  transformación.  En  general  llamaremos  un  vector  contravariante  a cualquier 
objeto  UM,  que  bajo  un  cambio  de  coordenadas  (6.3)  transforma  como 

dya 

Va  = 7TEiVr  (6-25) 

ax v 


Nótese  que  las  transformaciones  ortogonales  (4.5)  y (5.10)  son  casos  especiales  de  este  definición. 

Matemáticamente  un  vector  contravariante  localizado  en  un  punto  p de  la  variedad  no  es  un 
objeto  que  vive  en  la  variedad,  sino  en  el  espacio  tangente  Tp{ Ai)  del  punto  p.  Estamos  acostum- 
brados a pensar  en  vectores  como  objectos  que  conectan  dos  puntos  del  espacio.  Esta  idea  es 
correcta  para  M.N , pero  no  para  una  variedad  arbitraria,  por  el  hecho  de  que  no  es  posible  defi- 
nir curvas  preferidas  entre  dos  puntos  de  una  variedad  sin  suponer  ciertas  condiciones  sobre  las 
propiedades  geométricas.  (La  razón  porqué  la  idea  sí  es  correcta  en  M N es  porque  en  cada  punto 
su  espacio  tangente  es  el  mismo  R N , de  modo  que  podemos  identificar  los  espacios  tangentes  y 
la  misma  variedad.)  El  espacio  tangente  Tp{M.)  en  un  punto  p es  el  conjunto  de  todas  los  vectores 
colocados  en  p (véase  figura  6.2)  y es  un  espacio  vectorial  A' -dimensional.  El  conjunto  de  todos 
los  espacios  tangentes  de  todos  los  puntos  p de  la  variedad  se  llama  el  haz  tangente  T( JA). 


En  analogía  con  (4.16)  y (6.25),  un  vector  covariante  es  un  objeto  Wp  que  transforma  bajo  (6.3) 
como 


Wa  = 


(6.26) 


o sea,  que  transforma  con  la  matriz  inversa  (M_1)7‘a  = dxt'/dy1'.  Matemáticamente  un  vector 
covariante  es  una  uno-forma,  un  operador  que  actúa  sobre  vectores  (contravariantes)  para  dar  un 
escalar  (físicamente  hablando:  el  producto  escalar  de  un  vector  covariante  y uno  contravariante 
es  un  escalar).  Los  vectores  covariantes  son  elementos  del  espacio  cotangente  T*(M)  o el  espacio 
dual. 


Sabiendo  como  transforman  los  vectores  co-  y contravariantes  bajo  cambios  generales  de  coor- 
denadas, es  obvio  generalizar  las  definiciones  a tensores  de  rango  ( m,n ).  Un  tensor  de  rango 
(m,  n)  está  definido  como  un  objeto  que  transforma  bajo  cambios  generales  de  coordenadas  co- 
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mo 


rJ^l¿  1 • • •l-ím 


dx^1  dx Atm  dy /?1  dy^n 


rj-iai. 


Pl-Pn 


(6.27) 


n dyai  dyam  dxUl  dxUn 

Del  mismo  modo  está  claro  que  todas  las  operaciones  algebraicas  con  vectores  y tensores  defini- 
das en  la  sección  4.6  son  fácilmente  generalizables. 

En  la  sección  6.1  hemos  introducido  la  métrica  a través  del  producto  escalar  de  los  vectores  de 
base.  También  se  puede  obtener  la  expresión  para  gay  a través  del  cambio  de  coordenadas  (6.22). 
Si  (¡liv  es  la  expresión  de  la  métrica  en  las  coordenadas  x,í , el  elemento  de  línea  en  las  coordenadas 
ya  viene  dado  por 


ds2  = gílvdx‘idxv  = 9^-^;^adyo‘dy0  = ga0dyady /3, 


9^d ya  dyd1 


(6.28) 


donde  en  la  segunda  igualdad  hemos  utilizado  las  ecuaciones  (6.23).  Nótese  que  la  relación  entre 

9ap  Y 9nv 

finr1' 

(6.29) 


9a0 


l9\iv 


dya  dyd" 

nos  dice  que  la  métrica  es  un  tensor  de  rango  (0,  2),  como  en  el  caso  de  las  transformaciones 
globales.  Además  es  casi  igual  que  la  expresión  (6.10),  sólo  que  aquí  en  general  no  será  posible 
relacionar  la  métrica  gay  con  la  plana  <5,,  (y^). 

También  aquí  la  métrica  juega  el  mismo  papel  que  la  métrica  plana:  con  ella  y su  inversa  po- 
demos contraer  tensores,  subir  y bajar  indices  y convertir  vectores  covariantes  en  contravariantes 
y vice  versa: 

Vlt  = g^Vv,  Vv  = g^Vv.  (6.30) 

El  producto  escalar  entre  dos  vectores  por  lo  tanto  está  definida  de  la  manera  usual  y es  indepen- 
diente del  sistema  de  coordenadas  utilizado 


^ 


dya  dyP  dx11  dx¡ 


9a0 


D7— — rEE5  = gapVaW0  = VaW° 


dy'i  ’ dy 5 


donde  en  la  penúltima  igualdad  hemos  utilizado  que  por  la  regla  de  la  cadena 

dy^chf_  _ 
dx v dy^  7 


(6.31) 


(6.32) 


Aunque  (6.29)  nos  dice  que  en  general  no  es  posible  transformar  la  métrica  de  una  variedad 
arbitraria  en  la  métrica  plana,  sí  hay  una  propiedad  matemática  que  va  a jugar  un  papel  impor- 
tante en  el  desarollo  de  la  relatividad  general:  en  cada  punto  p de  la  variedad  es  posible  elegir  un 
sistema  de  coordenadas  z ’ tal  que  la  métrica  es  la  métrica  plana  S?J  (y^)  en  una  pequeña  región 
alrededor  de  p.  Para  ser  más  preciso,  desarollando  las  métricas  y el  cambio  de  coordenades  en  la 
expresión  (6.29)  en  un  desarrollo  de  Taylor,  se  puede  ver  que  tenemos  suficiente  libertad  para  ele- 
gir los  componentes  de  la  métrica  y los  parámetros  del  cambio  de  coordenadas  tal  que  a primer 
orden  la  métrica  es  euclídea  y que  todas  las  primeras  derivadas  digij  son  cero.  Sin  embargo,  no 
hay  suficiente  libertad  como  para  también  poner  las  segundas  derivadas  didjgki  igual  a cero.  Las 
coordenadas  que  satisfacen  esta  condición  se  llaman  las  coordenadas  geodésicas  o las  coordenadas 
localmente  inerciales. 

La  desviación  local  de  una  métrica  gl:]  de  la  métrica  plana  S?J  (y^)  es  por  lo  tanto  un  efecto  de 
segunda  orden.  Matemáticamente  hablando  g.¿j  será  de  la  forma  S7J  (/¡¡n,)  solamente  en  el  punto  p, 
ni  siquiera  en  una  pequeña  región,  ya  que  las  derivadas  segundas  no  son  cero.  Desde  el  punto  de 
vista  físico  siempre  habrá  una  pequeña  región  donde  no  se  puede  detectar  este  efecto  de  segundo 
orden.  La  extensión  de  esta  región  dependerá  de  la  sensibilidad  de  los  aparatos  experimentales 
usados. 
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Nótese  que  las  coordenadas  localmente  inerciales  serán  diferentes  en  puntos  diferentes  (sino 
un  solo  mapa  hubiera  sido  suficiente  para  cubrir  toda  la  variedad).  Esto  coincide  con  la  idea 
rudimentaria  que  temamos  de  una  variedad:  un  conjunto  de  parches  que  son  localmente  planos  y 
"pegados"  de  forma  suave  tal  que  forma  un  espacio  que  globalmente  no  es  plano.  En  el  siguiente 
capítulo,  una  vez  introducido  conceptos  como  la  conexión  y la  curvatura,  formalizaremos  más 
esta  propiedad. 


6.4.  Ejemplo  concreto:  cambios  de  coordenadas  en  §2 


Considera  la  esfera  bidimensional  §2  con  radio  R$,  parametrizada  de  la  manera  usual  por 
el  ángulo  polar  9 y el  ángulo  azimutal  p.  La  métrica  en  estas  coordenadas  viene  dada  por  la 
conocida  expresión 

ds2  = í?q  (d,02  + sin2  9dp2^ . (6.33) 

Obsérvese  que  este  elemento  de  línea  reproduce  exactamente  las  expresiones  conocidas  para  la 
distancia  entre  dos  puntos  en  §2:  la  distancia  entre  dos  puntos  con  la  misma  longitud  (A ip  = 0) 
es  el  segmento  de  arco  A 6 multiplicado  por  el  radio  de  la  esfera,  mientras  la  distancia  entre  dos 
puntos  con  la  misma  latitud  (A 9 = 0)  viene  dada  por  el  segmento  de  arco  Ap,  multiplicado  por 
el  radio  Rq  sin  9 del  círculo  de  latitud. 

Consideramos  ahora  el  siguiente  cambio  de  coordenadas  y su  inversa 


Ro  sin  9 
1 — eos  9 


9 = 2arctg 


(6.34) 


Este  cambio  de  coordenadas  es  un  rescaleo  del  ángulo  polar  9,  que  está  bien  definido  en  todos 
los  puntos,  salvo  en  el  polo  norte  6 = 0.  Obsérvese  que  el  polo  sur,  9 = n,  se  corresponde  con 
r = 0,  mientras  el  ecuador,  9 = 7r/2  se  corresponde  con  r = R0.  Sin  embargo  r tiende  a infinito  en 
el  límite  en  que  9 tiende  a cero  y el  cambio  de  coordenadas  mismo  es  divergente  en  este  límite. 

Para  calcular  la  forma  de  la  métrica  en  las  coordenadas  (r,  p),  utilizaremos  la  expresión  (6.28). 
De  (6.34)  tenemos  directamente  que 


d9 


~2Ro 

H2o  + r 2 


dr , 


sin# 


2Rpr 

Rl  + r 2’ 


(6.35) 


donde  en  la  última  expresión  hemos  utilizado  la  fórmula  sin(2a)  = 2 tg  a / ( 1 + tg2  a).  Por  lo 
tanto,  la  expresión  para  la  métrica  de  la  S2  en  las  nuevas  coordenadas  es  (ejerc.) 


ds2 


(f?g+r2)2 


dr2  + r2dp2 


(6.36) 


Obsérvese  que  la  parte  entre  paréntesis  es  la  métrica  plana  de  R2  en  coordenadas  polares,  pero  el 
factor  no- trivial  delante  hace  que  la  métrica  total  no  sea  la  de  R2 . En  el  Capítulo  7 desarrollaremos 
técnicas  para  determinar  la  curvatura  de  variedades,  pero  a estas  alturas  ya  debería  quedar  claro 
que  la  métrica  (6.36)  no  puede  ser  la  de  R2,  puesto  que  no  hemos  hecho  nada  más  que  un  cambio 
de  coordenadas  en  la  esfera  bidimensional,  así  que  de  algún  modo  la  métrica  (6.36)  debe  seguir 
describiendo  la  esfera  (en  el  siguiente  capítulo  veremos  cómo). 

Sin  embargo,  sí  hay  una  explicación  de  por  qué  aparece  aquí  algo  tan  parecido  a la  métrica  de 
R2  en  coordenadas  polares.  El  cambio  de  coordenadas  (6.34)  tiene  la  interpretación  geométrica 
de  una  proyección  estereográfica  desde  el  polo  norte  a un  plano  que  pasa  por  el  ecuador,  y las 
coordenadas  (r,  p)  son  las  coordenadas  polares  en  ese  plano.  La  métrica  (6.36),  por  lo  tanto,  no 
es  la  métrica  euclidea  usual  en  el  plano,  sino  la  métrica  de  la  S2  inducida  en  el  plano  por  la 
proyección  estereográfica.  Las  propiedades  geométricas  del  plano  con  la  métrica  (6.36)  son  muy 
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diferentes  a las  del  plano  usual.  Por  ejemplo,  dos  puntos  cercanos  al  polo  sur  se  proyectan  a 
puntos  cerca  del  origen  del  plano  r = 0,  pero  dos  puntos  cercanos  al  polo  norte  se  proyectan  a 
puntos  lejos  del  origen  y lejos  uno  del  otro  (con  “lejos"  queremos  decir  lejos  en  términos  de  la 
métrica  usual  en  R2).  Sin  embargo,  el  prefactor  de  la  métrica  (6.36)  disminuye  muy  rápido  para  r 
grande,  de  modo  que  la  distancia  medida  por  la  métrica  inducida  es  la  misma  entre  ambos  pares 
de  puntos. 

Aunque  topológicamente  las  coordenadas  (r,  <p)  describen  un  plano,  geométricamente  la  métri- 
ca (6.36)  todavía  es  la  de  S2.3  En  el  siguiente  capítulo  estudiaremos  técnicas  para  distinguir  entre 
espacios  con  diferentes  propiedades  geométricas. 


3 El  hecho  de  que  el  cambio  de  coordenadas  (6.34)  sea  singular  en  el  polo  norte  es  una  ilustración  de  que  la  topología 
de  una  esfera  es  la  de  un  plano  más  un  punto  en  el  infinito. 
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Capítulo  7 

Cálculo  tensorial 


En  mi  vida  he  trabajado  tan  duramente:  he  llegado  a tener  un  gran  respeto  por  las  matemáti- 
cas, cuyas  partes  más  sutiles  había  considerado  hasta  ahora  ingenuamente  como  puro  lujo. 
Comparado  con  este  problema,  la  teoría  original  de  la  relatividad  [especial]  es  un  juego  de 
niños. 

(A.  Einstein  1912,  en  una  carta  a A.  Sommerfeld) 


En  este  capítulo  entraremos  en  el  corazón  de  la  matemática  de  tensores,  la  geometría  diferen- 
cial o el  cálculo  de  tensores.  Aquí  explicaremos  como  definir  operadores  diferenciales  en  varie- 
dades arbitrarias,  definiremos  la  curvatura  de  una  variedad  y explicaremos  el  papel  que  juega  la 
métrica  en  todo  esto.  Este  capítulo  es  sin  duda  técnicamente  el  más  difícil  de  este  curso,  pero  su 
contenido  es  de  crucial  importancia  para  el  desarollo  de  la  relatividad  general. 


7.1.  Transporte  paralelo  y la  conexión  afín 


Ya  hemos  visto  en  la  sección  6.1  que  hay  sutilezas  con  los  operadores  diferenciales  <9;,  = 
d/dx»,  si  los  dejamos  actuar  sobre  vectores  y tensores  en  un  sistema  de  coordenadas  curvilíneas 
en  R'v.  Aparecieron  de  manera  natural  los  símbolos  de  Christoffel Tp  , como  las  derivadas  de  los 
vectores  de  base  e;j).  Aquí  queremos  dar  una  descripción  independiente  de  una  base  y con  más 
rigor  matemático. 

De  manera  análoga  al  caso  de  las  transformaciones  ortogonales,  se  puede  demostrar  a través 
de  la  regla  de  la  cadena  que  la  derivada  de  un  campo  escalar  = dñ> /dx»  transforma  como 
un  vector  covariante  bajo  cambios  generales  de  coordenadas 


5$  _ <9$  dx » _ dx»  d $ 
dya  dx»  dya  dya  M 


(7.1) 


Con  la  definición  del  operador  d»  hay  que  tener  un  poco  más  de  cuidado.  Dado  que  en  las  coor- 
denadas x»  no  transforman  como  un  vector  bajo  cambios  generales  de  coordenadas,  la  cantidad 
Xf,  no  es  el  dual  de  x»  y el  operador  d j dx¡,  no  está  bien  definido.  Lo  más  sencillo  es  definir  el 
operador  dual  a ¿L  como  d»  = g»"d„.  Está  claro  entonces  que  se  comporta  como  un  vector 
contravariante. 

Por  otro  lado,  la  derivada  parcial  de  un  vector  o un  tensor  no  transforma  bien  bajo  cambio 
generales  de  coordenadas.  Efectivamente,  aplicando  la  regla  de  la  cadena  y usando  que  Va  trans- 


98 


Figura  7.1:  Comparando  vectores  en  distintos  puntos  de  la  variedad:  Los  vectores  \ V(p)}  en  py  | V(g))  en 
q viven  en  espacios  tangentes  diferentes,  TP(M)  y Tq{M.)  respectivamente.  Para  poder  compararlos,  hay 
que  definir  un  vector  | Vp(g))  en  q,  que  es  el  vector  \V{p))  transportado  paralelamente  hasta  qalo  largo  de 
una  curva  7. 


forma  como  un  vector,  tenemos  que 


daV* 


dx » 


v„  dx»  a2/ 

dya  dxv  ,J'  dya  dx»dxv  ’ 


(7.2) 


El  primer  término  de  la  derecha  sí  tiene  la  forma  adecuada  para  la  transformación  de  un  tensor  de 
rango  (1,1),  pero  tenemos  un  término  extra,  proporcional  a la  derivada  de  la  matriz  de  la  trans- 
formación La  presencia  de  este  término  es  debido  al  carácter  local  de  la  transformación, 

ya  que  en  el  caso  de  una  transformación  global  las  entradas  de  la  matriz  son  constantes. 

La  razón  por  qué  en  variedades  arbitrarias  la  derivada  parcial  de  un  vector  (o  un  tensor)  no 
es  un  tensor,  es  debido  al  carácter  local  de  las  transformaciones.  Más  precisamente,  si  tomamos  la 
derivada  de  un  campo  vectorial,  estamos  comparando  el  valor  del  campo  en  un  punto  p con  coor- 
denadas x »,  con  el  valor  del  campo  en  un  punto  q,  infinitesimalmente  cerca  de  p,  con  coordenadas 
x»  + Sx».  Pero  debido  al  carácter  local  del  cambio  de  coordenadas,  la  matriz  Mav  = dya/dx» 
tiene  un  valor  distinto  en  p que  en  q.  No  es  de  extrañar  por  lo  tanto  que 


lím 

Sxu—>0 


V»(q)-V»(p) 

5xu 


(7.3) 


no  transforma  bien,  ya  que  las  reglas  de  transformación  (6.25)  son  distintos  en  los  dos  puntos. 
(De  hecho,  el  término  extra  es  proporcional  a la  derivada  de  la  matriz  de  la  transformación.) 

Matemáticamente  hablando  el  problema  es  peor.  Ya  hemos  dicho  en  la  sección  6.3  que  los 
vectores  no  viven  en  la  variedad,  sino  en  el  espacio  tangente.  Si  queremos  comparar  dos  vectores 
en  los  puntos  py  q,  estamos  en  realidad  comparando  dos  objetos  que  viven  en  espacios  distintos, 
TP(M ) y Tq(M.)  respectivamente  (Véase  Figura  7.1).  Por  lo  tanto,  matemáticamente  la  expresión 
(7.3)  no  tiene  sentido. 

Claramente,  lo  que  necesitamos  es  un  vector  Vffq)  en  el  punto  q que  tiene  la  información 
sobre  el  vector  V»(p)  y que  podemos  comparar  bien  con  V»(q).  El  vector  V»(q)  es  el  transportado 
paralelo  de  V»(p).  La  idea  es  que  en  una  variedad  arbitraria,  un  campo  vectorial  puede  cambiar  de 
punto  en  punto  por  dos  razones  distintas:  o bien  por  las  variaciones  del  mismo  campo  (igual  que 
en  Rv),  o bien  por  los  efectos  de  la  variedad.1  El  transportado  paralelo  Vf  (q)  sería  por  lo  tanto 
el  vector  V»(p)  en  el  punto  q "si  el  campo  vectorial  no  hubiera  cambiado",  es  decir  "si  el  cambio 
sólo  hubiera  sido  causado  por  la  variedad".  Una  vez  construido  Vf(q),  el  objeto 


lím 

Sx"— »0 


V»(q)  - V»(q) 
Sx1' 


(7.4) 


'Un  ejemplo  físico  de  lo  primero  sería  un  campo  vectorial  correspondiente  a la  dirección  y fuerza  del  viento  en  ca- 
da punto  de  la  Tierra.  Las  variaciones  de  este  campo  vectorial  entonces  son  debidas  a la  circunstancias  meteorológicas 
distintas  en  diferentes  puntos.  Un  ejemplo  de  lo  segundo  sería  un  campo  vectorial  constante  apuntando  al  Polo  Norte. 
Aquí  también  varía  el  campo  vectorial  de  punto  en  punto,  pero  por  razones  geométricas  (y  no  dinámicas):  la  dirección 
norte  es  distinta  en  diferentes  puntos  de  la  Tierra. 
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estaría  bien  definido,  puesto  que  VM(g)  y Vp(q)  viven  en  el  mismo  espacio. 

La  pregunta  inmediata  que  surge  ahora  es  ¿cómo  se  define  el  vector  Vff{q)l  En  otras  palabras, 
¿cómo  se  identifica  el  vector  de  Tq(M)  que  es  paralelo  a \n'  (p)  en  TP(M)7  En  realidad  esta  pre- 
gunta es  imposible  contestarla  en  esta  forma,  porque  en  una  variedad  arbitraria  el  resultado  de 
un  transporte  paralelo  de  un  vector  de  un  punto  p a otro  q depende  de  la  curva  que  uno  sigue 
para  ir  de  p a q (vease  figura  7.3).  Como  veremos  más  adelante  en  la  sección  7.3,  esta  propiedad  es 
básicamente  la  definición  de  curvatura  en  una  variedad.  Para  determinar  cuál  es  el  vector  Vp(q) 
en  Tq(M.),  tenemos  que  decir  cómo  hemos  transportado  l/,l  (p)  hasta  el  punto  q. 

Supongamos  que  transportamos  el  vector  Vp(p)  hasta  q a lo  largo  de  una  de  las  direcciones 
de  coordenadas.  Es  decir,  si  el  punto  p tiene  coordenadas  xIJ  y el  punto  q coordenadas  xJ1  + Sx11 
y trasladamos  el  vector  Vp{p)  a lo  largo  del  intervalo  Sx11,  podemos  escribir  el  nuevo  vector 
1 AM(g)  como  = Vp(p)  + 8Vtl.  En  otras  palabras,  el  vector  transportado  paralelo  es  un  vector 

original  más  un  término  (¡no  tensorial!)  de  corrección,  que  depende  de  5xp.  Es  razonable  suponer 
que  el  término  de  corrección  es  lineal  tanto  en  8xp  como  en  Vp(p).  Por  lo  tanto  tenemos  que 

Vf(q)  = v»  - r lp8xvVHp),  (7.5) 

donde  los  Ypp,  que  aparecen  como  los  coefficientes  de  proporcionalidad,  es  la  conexión  afín  o 
simplemente  la  conexión.  El  signo  menos  hemos  elegido  por  futuro  comodidad.  La  conexión  es 
el  conjunto  de  N3  funciones  (en  una  variedad  A’ -dimensional)  de  las  coordenadas  x1'  que  nos 
cuentan  cómo  hacer  el  transporte  paralelo  entre  los  puntos.  Concretamente,  Yf  es  el  cambio  de 
la  componente  //  del  vector  en  la  dirección  p bajo  el  desplazamiento  en  la  dirección  v.  Los  P{jp's 
que  hemos  encontrado  en  la  sección  6.1  son  un  caso  especial  de  la  conexión  introducido  en  (7.5), 
llamado  la  conexión  de  Levi-Civita,  que  definiremos  en  breve. 

Podemos  ilustrar  esto  con  el  ejemplo  de  transporte  paralelo  en  R2.  Las  componentes  cartesia- 
nas V1  no  cambian  bajo  una  traslación  en  una  dirección  x3 , así  que  en  coordenadas  cartesianas 
todos  las  componentes  de  la  conexión  son  cero.  Sin  embargo,  en  coordenadas  polares  (r,  <p)  las 
componentes  no  nulas  de  la  conexión  son2 

rrV  = Kr  = r_1-  r^  = ~r’  (7-6) 

lo  que  implica  que  bajo  un  desplazamiento  en  r el  vector  transportado  paralelo  tiene  componen- 
tes 

v;(q)  = Vr(p),  V*{q)  = v*{p)  - ^(p)Sr,  (7.7) 

y bajo  un  desplazamiento  en  la  dirección  <p 

Vpr(q ) = Vr(p)  + rVv(p)5ip,  V*(q)  = V*(p)  - \vr{p)6p.  (7.8) 

Dejamos  como  ejerció  comprobar  que  este  resultado  es  efectivamente  lo  que  sale  al  traslazar 
un  vector  radialmente  de  un  punto  p con  coordenadas  (r,  <p)  a uno  punto  q con  coordenadas 
(r  + Sr,  <p),  y angularmente  a un  punto  q con  coordenadas  (r,  ¡p  + 5p)  respectivamente  (vease 
Figura  7.2). 

La  pregunta  de  antes,  sobre  cómo  identificar  el  vector  de  Tq(M.)  que  es  paralelo  a V^(p),  se 
puede  responder  ahora  de  la  siguiente  manera:  Dada  una  conexión  Tppl/  y dada  una  curva  7 entre 
los  puntos  p y <7,  se  identifica  Vffq)  a través  de  la  formula  (7.5).  Pero  la  pregunta  básica  queda: 
¿cuál  es  la  conexión  adecuada  a utilizar  en  una  variedad  determinada?  ¿Cómo  conseguimos  la 
forma  de  la  N3  funciones  Lj),,  para  poder  aplicar  la  formula  (7.5)? 

La  respuesta  otra  vez  es  difícil.  Resulta  que  en  una  variedad  determinada  hay  muchas  (¿in- 
finitas?) conexiones  posibles,  que  todos  darán  una  respuesta  diferente  a cuál  es  el  vector  Vffq). 

2En  realidad  estamos  otra  vez  utilizando  la  conexión  de  Levi-Civita. 
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Figura  7.2:  El  transporte  paralelo  en  R2  (utilizando  la  conexión  de  Levi-Civita)  en  coordenadas  cartesianas 
y polares.  Las  componentes  del  vector  siguen  inalteradas  bajo  un  traslado  en  una  dirección  cartesiana.  Sin 
embargo,  al  trasladar  un  vector  Vfl(p)  de  p a q en  una  dirección  radial  cambia  la  componente  Vv.  Si  se 
traslada  en  la  dirección  p,  cambian  tanto  la  componente  Vr  como  Vv. 


La  eleción  de  cuál  conjunto  de  funciones  F(j„  utilizamos  es  arbitraria.  Esto  es  el  resultado  del  he- 
cho de  que  en  realidad  no  hay  una  manera  natural  de  comparar  vectores  de  diferentes  espacios 
vectoriales  y que  en  variedades  arbitrarias  no  existe  una  noción  natural  de  paralelo. 

Afortunadamente,  si  existe  una  métrica  sobre  nuestra  variedad,  podemos  definir  una  cone- 
xión preferida,  con  ciertas  propiedades  que  la  hace  única.  Esta  conexión  es  la  conexión  de  Levi- 
Civita  y la  estudiaremos  en  más  detalle  en  la  sección  7.6.  Pero  merece  la  pena  enfatisar  que  las 
condiciones  que  satsiface  la  conexión  de  Levi-Civita  para  tener  las  mencionadas  propiedades,  son 
sobre  todo  condiciones  físicas,  no  tanto  matemáticas.  Matemáticamente  no  hay  ninguna  razón  pa- 
ra preferir  la  conexión  de  Levi-Civita  ante  cualquier  otra  conexión  posible,  salvo  su  unicidad.  De 
momento  seguiremos  trabajando  con  una  conexión  general,  hasta  que  avisamos  de  lo  contrario. 


7.2.  La  derivada  covariante 


Supongamos  ahora  que  tenemos  una  conexión  Pjjj,,  que  nos  dice  cómo  hacer  transporte  para- 
lelo a vectores  de  un  punto  p a un  punto  q.  Con  esta  estructura  matemática,  podemos  definir  un 
nuevo  tipo  de  operador  diferencial  que  no  tiene  el  problema  de  la  derivada  parcial,  es  decir  que 
transforma  como  un  tensor  bajo  cambios  generales  de  coordenadas. 

Aplicando  la  fórmula  (7.4),  donde  utilizamos  la  expresión  (7.5)  para  V£{q)  obtenemos  un 
operdaor  diferencial,  llamada  la  derivada  covariante: 

VvVp  = 8^  + Y^pVp.  (7.9) 

La  derivada  covariante  actúa  por  lo  tanto  como  una  parcial,  pero  luego  suma  un  término  de  co- 
rrección, lineal  en  V^,  debido  al  transporte  paralelo  del  vector.  Podemos  generalizar  el  concepto 
de  derivada  covariante  a lo  largo  de  una  dirección  a una  derivada  covariante  a lo  largo  de  una 
curva  xM(r)  definiendo  como  V7VM  = ur‘X7 PVIL,  donde  u p = dx^^/dr  es  el  vector  tangente  a la 
curva  x1'  (r).  Decimos  entonces  que  un  vector  es  transportado  paralelo  a lo  largo  de  una  curva 
x^{t)  si  PY1'  = 0 a lo  largo  de  toda  la  curva. 

La  derivada  covariante  (el  operador  V se  pronuncia  nabla)  comparte  con  la  derivada  parcial 
las  propiedades  de  linearidad  y el  regla  del  producto  de  Leibniz3 

Vtl{aVv+pWv)  = + pVltWv, 

Vli(VvWp)  = (VliVv)Wp  + Vv(\/líWP),  (7.10) 

3Para  comprobar  la  veracidad  de  la  regla  de  Leibniz,  es  necesario  saber  la  fórmula  de  la  derivada  covariante  actuando 
sobre  un  tensor  de  rango  (2,  0).  Con  una  derivación  idéntica  a la  de  la  derivada  covariante  para  vectores,  se  demuestra 
fácilmente  que  VpTvp  = dpTvP  + r vp>TXp  + (ejerc)- 
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pero  encima  tiene  la  propiedad  que  transforma  bien  como  un  tensor  de  rango  (1, 1),  por  lo  menos 
si  elegimos  bien  las  reglas  de  transformación  de  la  conexión.  Efectivamente,  exigiendo  que 


a dya  dxp  M 


y rellenando  la  definición  (7.9)  encontramos  que 

■{d^ + YplvVv) 


aF+r7y/3  _ 

óaV  + l^v  " dy-dxP' 


f)x ^ 3^‘v^ 

= dav - ^-v»-  y 


dya  dxpdxp 


dya  dxp 


(7.11) 


(7.12) 


donde  en  la  segunda  igualdad  hemos  utilizado  las  reglas  (7.2)  de  transformación  de  dpVp.  Qui- 
tando a la  izquierda  y a la  derecha  el  término  3a  V7  y escribiendo  el  vector  en  las  coordenadas 
xp,  obtenemos 


r7  = (W_d]PrP  dxp  d2y 7 

aP  dxv  dya  dxp  dya  dxpdxv 


(7.13) 


Dado  que  este  relación  tiene  que  ser  verdad  para  cualquier  vector  Vv , encontramos  que  las  reglas 
de  transformación  de  la  conexión  vienen  dadas  por 


7 dx^dx^dy7  d2y7  dxp  dxv 

Qya  Qy/3  gxP  p-v  dxpdxv  dya  dyP 


(7.14) 


Vemos  por  lo  tanto  que  Ypv  no  se  comporta  como  un  tensor  de  rango  (1, 2),  debido  al  segundo 
termino  de  la  derecha.  En  cierto  modo  esto  era  de  esperar:  dado  que  dp  Vp  no  transforma  como  un 
tensor,  pero  Vp  sí,  es  preciso  que  los  I 'p  transforman  con  un  término  de  corrección  que  cancela 
el  término  en  la  transformación  de  dpVp.  Obsérvese  sin  embargo,  que  el  término  no-tensioral  de 
las  reglas  de  transformación  (7.14)  es  independiente  de  de  modo  que  la  diferencia  Kpv  = 
Tp  — Yp„  entre  dos  conexiones  sí  transforma  como  un  tensor. 

En  la  sección  anterior  hemos  visto  en  R2  que  en  coordenadas  cartesianas  los  rh  son  todos 
cero,  mientras  en  coordenadas  polares  los  YPJV  en  general  no  lo  son.  Esto  es  una  consecuencia  del 
carácter  no-tensorial  de  la  conexión.  Si  los  Yp  transformase  como  un  tensor  y todos  los  com- 
ponentes fueran  cero  en  coordenadas  cartesianas,  serían  también  cero  en  todos  los  sistemas  de 
coordenadas,  lo  que  obviamente  no  es  el  caso. 

En  (7.9)  hemos  construido  la  derivada  covariante  de  un  vector  contravariante  Vp.  Para  ver 
cómo  actúa  la  derivada  covariante  en  un  vector  covariante  Wp,  es  suficiente  darnos  cuenta  de 
que  la  derivada  covariante  de  un  escalar  <f>  es  simplemente  la  derivada  parcial: 


= d p(¡). 


(7.15) 


Podemos  por  lo  tanto  construir  un  escalar  é de  la  contracción  de  un  vector  covariante  y uno 
contravariante  <f>  = Wp  Vp  y exigir  que  la  derivada  covariante  actuando  sobre  é es  lo  mismo 
que  la  derivada  parcial.  Supongamos  que  la  derivada  covariante  de  Wp  es  de  la  forma  V;,  Wv  = 
0P  Wv  + Yp  Wp,  donde  los  N3  funciones  Ypv  quedan  por  determinar.  Entonces  tenemos  que 


V¿WvVv) 


{V  pWv)Vv + Wv{V  ¿T) 

(dpW„  + YPtvWp)Vv  + W^V"  + Y”pVp) 
d¿WvVv)  + fp^wpvv  + YPÍVWPVV 
dp{WvVv). 


(7.16) 
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Esto  claramente  sólo  puede  ser  verdad  si  tp  = -rj'¡/(  o en  otras  palabras,  si  la  derivada  cova- 
riante actuando  sobre  un  vector  covariante  es  de  la  forma 

- r pvwp.  (7.17) 

Sabiendo  cómo  actúa  una  derivada  covariante  sobre  vectores  co-  y contravariantes,  podemos 
definir  cómo  actúa  sobre  de  rango  (1, 1)  si  construimos  un  tensor  l)"  = XfW1' . No  es  difícil  de 
ver  que  la  derivada  covariante  viene  dada  por 

vpT/  = + r;Ar/.  (7.18) 

En  otras  palabras,  la  derivada  covariante  actuando  sobre  un  tensor  de  rango  ( 1 , 1 ) es  la  derivada 
parcial  más  un  término  de  corrección  por  cada  índice,  con  los  signos  apropiados  según  el  caso. 
En  general  entonces  la  derivada  covariante  de  un  tensor  de  rango  (m,  n)  viene  dada  por 

\7pT^-^Vl...Vn  = dpT* + . . . (7.19) 

i p A rri  l_L1...flrn  pA  rpfj,1...flrn 

' L p\  -1  Vi...Vn  L pv  \V2..Mn  •••  L pVn-1 

Por  último,  dada  una  curva  C en  la  variedad,  entonces  un  tensor  es  transportado 

paralelo  a lo  largo  de  la  curva,  si  la  derivada  covariante  del  tensor  a lo  largo  de  la  curva  es  cero, 

upypT^--^Vi  Vn  = 0,  (7.20) 

donde  vJ‘  es  el  vector  tangente  a la  curva  G. 


7.3.  Curvatura  y el  tensor  de  Riemann 

Intuitivamente  tenemos  una  idea  más  o menos  vaga  de  lo  que  es  curvatura.  Nos  podemos 
imaginar  una  superficie  bidimensional  curva,  pero  un  espacio  tridimensional  con  curvatura  ya  es 
mucho  más  difícil.  Intuitivamente  estamos  acostumbrados  de  pensar  en  (hiper)superficies  curvos 
como  embebidas  en  un  espacio  plano  de  dimensión  más  grande,4  pero  en  esta  sección  veremos 
que  el  concepto  de  variedades  con  curvatura  existe  independientemente  de  una  inmersión  en 
un  espacio  más  grande.  En  otras  palabras,  una  hormiga  bidimensional  puede  distinguir  si  la 
superficie  que  recorre  tiene  curvatura  o no,  estudiando  la  geometría  de  la  variedad,  sin  tener  ni 
idea  si  esta  superficie  está  embebida  en  R3. 

Ya  hemos  dicho  antes  que  en  general  el  resultado  del  transporte  paralelo  de  un  vector  de 
un  punto  p a un  punto  q depende  de  la  trayectoria  entre  p y <¡.  Por  ejemplo,  en  una  2-esfera  §2, 
podemos  trasladar  un  vector  V de  un  punto  p en  el  ecuador  al  punto  q en  el  polo  norte,  o bien 
primero  un  tramo  al  oeste  hasta  un  punto  si  y luego  hacia  el  norte,  o bien  primero  hacia  el  este 
hasta  un  punto  S2  y luego  hacia  el  norte  (véase  Figura  7.3).  Los  vectores  resultantes,  V\  y V->, 
difieren  con  un  ángulo  a,  igual  al  ángulo  entre  las  dos  trayectorias  dirigidas  hacia  el  polo  norte. 

El  hecho  de  que  los  vectores  no  coincidan  es  una  manifestación  de  la  curvatura  de  la  variedad 
encerrada  por  las  curvas.  Básicamente  es  la  definición  de  curvatura:  diremos  que  una  variedad  es 
curva  si  el  transporte  paralelo  de  un  vector  a través  de  una  curva  cerrada  resulta  en  un  vector  diferente  al 
volver  en  el  punto  de  salida.  Con  esta  definición  está  claro  que  la  curvatura  de  una  variedad  tiene 
todo  que  ver  con  la  manera  cómo  hacemos  el  transporte  paralelo  en  la  variedad  y por  lo  tanto 
con  la  conexión  Tp  que  hemos  elegido. 

Para  definir  bien,  es  decir  de  manera  cuantitativa,  la  curvatura  de  una  variedad  considera- 
mos el  transporte  paralelo  de  un  vector  a lo  largo  de  un  paralelogramo  infinitesimal  cuyos  lados 

4E1  Teorema  de  inmersión  de  Whitney  dice  que  cualquier  variedad  n-dimensional  se  puede  embeber  en  el  espacio  euclídea 
R2rl.  La  botella  de  Klein  es  un  ejemplo  de  una  superficie  bidimensonal  que  no  se  puede  embeber  en  R3,  pero  sí  en  R4. 
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Figura  7.3:  En  una  variedad  con  curvatura,,  el  resultado  del  transporte  paralelo  de  un  vector  de  un  punto 
p a un  punto  q depende  de  la  curva  entre  py  q que  uno  usa  para  transportar  el  vector. 


consisten  de  los  vectores  dx1'  y dx" , un  desplazamiento  infinitesimal  en  las  direcciones  x1'  y x" 
respectivamente.  En  particular,  calculamos  la  diferencia  entre  trasladar  el  vector  Vx  primero  a lo 
largo  de  dx'1  y luego  a lo  largo  de  dxv  y transladarlo  primero  dx"  y después  dx11.  En  otras  pala- 
bras, tenemos  que  calcular  el  conmutador  de  las  derivadas  covariantes  [VM,  V„]  = V;,  V„  — V„  V/( 
actuando  sobre  el  vector  Vx. 

En  un  primer  paso  calculamos 

VMV„VA  = dlldvVx  + d^xpVp  + YxpdliVp 

-T^dpvx  - r^rxav°  + vxpd„vp  + rxprpav°,  (7.21) 

de  modo  que  el  conmutador  viene  dado  por 

[VM,  V„]VX  = RpvpxVp  - TP„VPVX,  (7.22) 

donde 


R 


V-vp 


b rA  -/)  rA  4-  rA  rCT  — rA  ra 

l/Aa-l  vp  L/z/J-  ^ p ~r  j-  Vp  i vcyi-  pp-, 


cpp 
- - pis 


rp  _ tp 

X pLV  L VpL’ 


(7.23) 


Vemos  que,  en  contraste  con  las  derivadas  parciales,  el  conmutador  de  dos  derivadas  covariantes 
no  es  cero,  sino  que  consiste  de  dos  partes.  Una  parte  es  proporcional  a vector  Vp , donde  el 
factor  de  proporcionalidad  Rpupx  es  el  tensor  de  Riemann.  Esta  parte  mide  la  diferencia  entre  el 
transporte  paralelo  de  Vp  por  una  trayectoria  y por  otra  y es  por  lo  tanto  una  medida  de  la 
curvatura  del  espacio  encerrado  en  el  paralelogramo  (véase  Figura  7.4). 

La  segunda  parte  es  proporcional  a la  derivada  covariante  de  Vp  y el  factor  de  proporcionali- 
dad es  la  parte  antisimétrica  de  la  conexión,  llamado  el  tensor  de  torsión.  El  tensor  de  torsión 
mide  el  grado  en  que  cierre  el  paralelograma.  Es  decir,  si  transportamos  paralelamente  el  vector 
infinitesimal  dxJ1'  a lo  largo  de  dx" , resultando  en  un  vector  dx'1'  y lo  comparamos  con  el  vector 
dx'",  siendo  el  transportado  paralelo  de  dx1'  a lo  largo  de  dx1',  resulta  que  en  general  los  vectores 
dx'1'  y dx'"  no  terminan  en  el  mismo  punto  (vease  figura  7.4).  En  otras  palabras,  en  general  el  pa- 
ralelograma dxp-d. x "-dx^'-d. x ' " no  necesariamente  cierra.  Sólo  si  nos  restringimos  a conexiones 
simétricas  (una  de  las  condiciones  para  la  conexión  de  Levi-Civita),  el  tensor  de  torsión  es  cero  y 
las  trayectorias  dxp-dx"  y dx"-dxl‘  formarán  un  paralelograma  cerrado. 

Con  un  mismo  calculo  que  en  el  caso  del  vector  contravariante,  podemos  calcular  el  conmu- 
tador sobre  escalares  y tensores  en  general.  Para  un  escalar  4>  tenemos  que  (ejerc.) 


[v^,vv]0  = - r^vp0, 


(7.24) 
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Figura  7.4:  El  tensor  de  Riemann  y el  tensor  de  torsión:  El  tensor  de  Riemann.  Rpvpx  mide  la  diferencia 
en  el  transporte  paralelo  de  un  vector  en  un  paralelograma  infinitesimal  y es  una  medida  de  la  curvatura 
encerrada  en  el  paralelograma.  El  tensor  de  torsión  Tpv  es  la  parte  antisimétrica  de  la  conexión  y mide 
hasta  qué  punto  el  paralelograma  está  cerrada. 


y para  un  tensor  Spi—pm  \1...\n  (ejerc.) 


-R^xS  Sp'-p 


= iWPlSCTP2-Pm  Al...An+  ...  + RpucrPm  SPl'a 

*x2...xn  - ...  - R^x^S^-  ^x,...*  ~ Tf^(JSPl-pmx1...xn-  (7.25) 


Como  ya  lo  indican  sus  nombres,  el  tensor  de  Riemann  y el  tensor  de  torsión  son  tensores  de 
rango  (1, 3)  y (1, 2)  respectivamente,  a pesar  de  que  están  construidos  a base  de  objetos  que  no 
son  tensoriales  (derivadas  parciales  y conexiones).  Se  puede  comprobar  el  carácter  tensorial  de 
R¡ivPx  y Tfj  calculando  sus  reglas  de  transformación  a lo  bruto,  pero  es  más  fácil  darse  cuenta 
que  todos  los  elementos  del  lado  izquierdo  de  (7.22)  son  tensores,  así  que  el  lado  derecho  también 
tiene  que  transformar  como  un  tensor:  dado  que  la  torsión  es  un  tensor  por  ser  la  diferencia  entre 
dos  conexiones,  también  el  tensor  de  Riemann  tiene  que  tener  un  carácter  tensorial,  para  el  lado 
derecha  de  (7.22)  transforma  bien. 

Como  ya  hemos  dicho,  el  tensor  de  Riemann  mide  la  variación  de  un  vector  tras  transporte 
paralelo  alrededor  de  una  curva  cerrada.  En  particular,  si  el  tensor  de  Riemann  es  cero,  el  trans- 
porte paralelo  de  un  vector  no  depende  de  la  trayectoria,  lo  que  implica  que  la  variedad  es  plana. 
También  la  afirmación  opuesta  es  verdad:  en  el  espacio  plano  R N (o  el  espacio  de  Minkowski) 
la  conexión  l’p  es  idénticamente  cero  en  coordenadas  cartesianas  y por  lo  tanto  el  tensor  de  Rie- 
mann también  es  cero.  Y dado  el  carácter  tensorial  de  RPlUpx,  si  el  tensor  de  Riemann  es  cero  en 
coordenadas  cartesianas  también  lo  será  en  cualquier  otro  tipo  de  coordenadas  curvilíneas,  aun- 
que las  conexione  sno  necesariamente  lo  sean.  (Es  un  ejercicio  ilustrativo  calcular  i?Al¡,pA  de  R2  a 
partir  de  las  componentes  de  la  conexión  (7.6)  en  coordenadas  polares). 

Definimos  por  lo  tanto  que  una  variedad  es  plana  si  todas  las  componentes  del  tensor  de  Riemann 
Rflvpx  son  idénticamente  cero.  Por  otro  lado,  una  variedad  tiene  curvatura  si  por  lo  menos  una 
componente  de  Rpvpx  es  distinta  de  cero. 

Merece  la  pena  enfatisar  una  vez  más  el  hecho  que  elecciones  diferentes  para  la  conexión 
llevan  a diferentes  expresiones  para  el  tensor  de  Riemann,  y por  lo  tanto  a diferentes  nociones 
de  la  curvatura  en  la  misma  variedad.  Es  un  ejercicio  instructivo  ver  que  cambiando  la  conexión 
Tppv  — > Pjjj,  = r£„  + Kp,  con  Kpv  un  tensor  arbitrario,  el  tensor  de  Riemann  (y  por  lo  tanto  la 
curvatura)  cambia  como  (ejerc.) 

- R^PX  = R^PX  + - S7uKxp  + TfvKxp  + I<xaKfp  - KxaKfp.  (7.26) 

Vemos  por  lo  tanto  que  una  variedad  que  tiene  curvatura  con  cierta  conexión  Tppv,  puede  ser 
plana  con  una  eleción  apropidada  de  una  nueva  conexión  y vice  versa. 
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7.4.  Tensores  de  curvatura 


Habiendo  definido  el  concepto  de  curvatura  a través  del  tensor  de  Riemann  Rpupx,  resulta 
útil  estudiar  también  sus  simetrías  y algunas  tensores  formados  de  contracciones  de  Rpupx.  Para 
algunas  simetrías  será  conveniente  trabajar  con  la  variante  completamente  covariante  del  tensor 
de  Riemann  Rpup \ = g\aRpvpa . 

De  la  definición  (7.22)  está  claro  que  el  tensor  de  Riemann  es  antisimétrico  en  los  primeros 
dos  índices: 

RPvPx  = ~R,PPX.  (7.27) 


La  identidad  de  Jacobi  es  una  identidad  básica  en  teoría  de  grupos,  que  determina  el  orden 
de  las  operaciones  del  álgebra.  Aplicada  en  las  derivadas  covariantes  toma  la  forma 


[[Vp,  V„],  Vp]  + [[V„,  Vp],  VM]  + [[Vp,  V M] , V„]  — 0. 


(7.28) 


De  la  identidad  de  Jacobi  se  puede  derivar  dos  importantes  identidades  del  tensor  de  Riemann, 
llamadas  las  identidades  de  Bianchi.  La  primera  identidad  de  Bianchi  se  obtiene  actuando  con  la 
identidad  de  Jacobi  sobre  un  escalar  4>.  Tomando  en  cuenta  (7.24),  no  es  difícil  ver  que  el  tensor 
de  Riemann  y el  tensor  de  torsión  satisfacen  la  siguiente  identidad 


R 


PvP 


R, 


vPP 


TD  X Y7  rT'X  V7  rji\  ry  rji X , rruj  rri X _i_  rj~uj  rpX  _i_  rji<j  rri X A 

' J^ppu  ~ V n±i,p—  V vi  pp  ~ V p1  pv  i 1 pv1 pa  ' 1up1  pa  ' 1 pp1uo-  ~ u- 


(7.29) 


La  segunda  identidad  de  Bianchi  se  obtiene  actuando  con  la  identidad  de  Jacobi  sobre  un  vector 
contravariante  Vx, 


VvRpPa 


A 

HV±'-pT<J 


- TJ„,R 


- T¿pRpra 


X rpT  TD  X r\ 

1 pp^vrcr  — 


(7.30) 


Contrayendo  el  segundo  índice  del  tensor  de  Riemann  con  el  cuarto,  se  obtiene  el  tensor  de 
Ricci :5 

RPv  = RPPvp  = gpXRPPv\-  (7.31) 

Por  lo  tanto,  en  función  de  la  conexión  viene  dado  por 

Rp,  = dpTxXv  - axTxv  + r^rL  - r^r^A.  (7.32) 

En  general  en  tensor  de  Ricci  no  es  simétrico,  puesto  que  la  parte  antisimétrica  toma  la  forma 
(ejerc.) 

RpV  - RVp  = Rpvpp  - VpT£,  - VpT^  + V„T^  - TxJTpp  (7.33) 

Veremos  más  adelante  que  las  fórmulas  (7.29),  (7.30)  y (7.33)  se  simplicifarán  mucho  en  el  caso 
donde  elegimos  la  conexión  de  Levi-Civita. 

Contrayendo  los  dos  índices  del  tensor  de  Ricci,  se  obtiene  el  escalar  de  Ricci  o el  escalar  de 
curvatura : 

R = gpvRpv-  (7.34) 

Como  dice  el  nombre,  el  escalar  de  Ricci  es  un  escalar  y por  lo  tanto  un  invariante  bajo  cambios 
generales  de  coordenadas. 

Finalmente,  un  tensor  que  juega  un  papel  importante  en  la  Relatividad  general  es  el  tensor  de 
Einstein,  construido  del  tensor  de  Ricci,  el  escalar  de  Ricci  y la  métrica  como 

GPv  = RPv  — ^g^R-  (7.35) 

Igual  que  el  tensor  de  Ricci,  el  tensor  de  Einstein  en  general  no  es  simétrico. 

5 Hay  cierta  ambigüedad  en  la  definición  del  tensor  de  Ricci  en  la  literatura.  A veces  se  ve  definido  como  la  contracción 
del  primer  índice  con  el  cuarto,  lo  que  difiere  con  un  signo  menos  de  esta  definición.  Igual  que  en  el  caso  de  la  signatura  de 
la  métrica,  las  diferentes  definiciones  no  implican  diferencias  físicas  o matemáticas,  sino  solamente  se  trata  de  convenios 
diferentes.  La  elección  del  convenio  es  irrelevante  para  los  resultados  calculados.  Sin  embargo  es  importante  saber  cuál 
es  el  convenio  elegido  y ser  consecuente  en  el  resto  de  los  cálculos. 
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7.5.  Geodésicas 


En  R-v  las  rectas  son  curvas  preferidas  por  dos  razones  principales.  La  primera  razón  es  que 
son  las  curvas  más  cortas  entre  dos  puntos  p y q.  La  segunda  es  que  es  la  única  curva  donde  el 
vector  tangente  está  transportado  paralelamente  a si  mismo  a lo  largo  de  la  curva.  En  esta  sección 
veremos  como  podemos  generalizar  estos  conceptos  a variedades  más  generales. 

Si  hablamos  de  distancias  entre  dos  puntos,  es  necesario  introducir  una  métrica  g/íu  en  la  va- 
riedad. Llegado  a este  punto  es  importante  darse  cuenta  que  en  todo  este  capítulo  a penas  hemos 
hablado  del  papel  de  la  métrica.  Intuitivamente  tenemos  la  tendencia  a pensar  que  la  curvatura 
de  una  variedad  viene  dado  por  la  métrica,  pero  esto  no  es  verdad  en  general.  Acabamos  de  ver 
que  la  curvatura  de  una  variedad  se  manifiesta  en  el  hecho  de  que  un  vector  no  es  invariante 
bajo  transporte  paralelo  a lo  largo  de  una  curva  cerrada  y que  el  transporte  paralelo  viene  dado 
por  la  conexión  que  elegimos  en  la  variedad,  no  por  la  métrica.  Por  otro  lado,  en  el  Capítulo 
4,  hemos  visto  que  la  métrica  de  una  variedad  es  una  herramienta  que  relaciona  los  vectores  co- 
variantes y contravariantes,  y nos  permite  medir  las  distancias  entre  puntos  y los  ángulos  entre 
los  vectores.  En  particular,  la  métrica  no  dice  nada  sobre  cómo  transportar  vectores  y por  lo  tanto 
sobre  la  curvatura.  Sólo  en  el  caso  de  la  conexión  de  Levi-Civita,  que  introduciremos  en  la  sección 
7.6,  veremos  que  hay  una  la  relación  entre  las  dos  cosas. 

Resulta  por  lo  tanto  que  podemos  generalizar  el  concepto  de  la  recta  en  R-v  de  dos  maneras 
distintas  a espacios  arbitrarios:  una  es  a través  del  concepto  de  transporte  paralelo  y la  otra  a 
través  de  la  distancia  más  corta  entre  puntos.  Está  claro  que  con  una  conexión  general,  estas  dos 
generalizaciones  no  tendrán  nada  que  ver  la  una  con  la  otra. 

Consideramos  primero  la  generalización  de  la  segunda  característica:  una  geodésica  afín  es 
aquella  curva  x^(t)  donde  el  vector  tangente  a la  curva  itM  = jd'ÍT)  está  transportado  paralelo  a 
lo  largo  de  la  curva.  La  condición  de  transporte  paralelo  del  vector  u M a lo  largo  de  la  curva  xil(t) 
viene  dada  por  (7.20) 

0 = = 3P  + Y»pxvxp,  (7.36) 

donde  en  la  última  igualdad  hemos  utilizado  que  uvdv  = d/dr  es  la  derivada  direccional  en 
la  dirección  de  la  curva.  Es  ilustrativo  calcular  la  ecuación  de  una  recta  en  M.N  en  coordenadas 
curvilíneas  a partir  de  la  ecuación  en  coordenadas  cartesianas  xl  = 0 y darse  cuenta  que  se 
obtiene  justo  (7.36). 

Obsérvese  que  arriba  r es  simplemente  el  parámetro  afín  parametrizando  la  curva  xM(r)  y no 
(necesariamente)  el  tiempo  propio  en  el  caso  de  curvas  temporales.  Es  más,  como  aquí  no  hemos 
utilizado  la  métrica  no  tenemos  manera  de  calcular  la  longitud  de  las  geodésicas  afines. 

La  otra  generalización  de  una  recta  en  variedades  arbitrarios  es  buscando  la  curva  más  corta 
entre  dos  puntos.6  Las  geodésicas  de  este  tipo  se  llaman  geodésicas  métricas  y para  conexiones 
arbitrarias  no  coinciden  con  las  geodésicas  afines. 

La  mejor  manera  de  definir  la  distancia  más  corta  entre  dos  puntos  es  a través  de  cálculo 
variacional:  una  geodésica  métrica  es  la  curva  x^(t)  entre  dos  puntos  p y q cuya  longitud 

s = í dr \J g^vx^xv  (7.37) 

Jp 

es  estacionaria  bajo  pequeñas  variaciones  de  la  curva  y de  la  métrica 

x1*  ->  x11  + Sx^,  g^  — > + dpgll„5xp.  (7.38) 

Aquí,  r parametriza  la  curva  xd!  (r)  y anotamos  la  derivación  con  respecto  a r con  i:1'  = d/xd1  ¡ dr.  La 
geodésica  corresponde  por  lo  tanto  a la  curva  por  la  cual  Ss  = 0,  que  viene  dado  por  la  ecuación 

6La  definición  de  la  geodésica  como  la  distancia  más  corta  entre  dos  punto  es  solamente  válida  en  espacios  rieman- 
nianos  y en  espacios  lorentzianos  en  el  caso  de  geodésicas  espaciales.  Geodésicas  temporales  son  las  que  maximizan  el 
tiempo  propio,  debido  al  signo  relativo  entre  las  coordenadas. 
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de  Euler-Lagrange 


d / SL  \ SL 
dr  V Si ^ ) Sx^ 


= O, 


(7.39) 


donde  L = ds/dr  = \J gl,^xilxv  es  el  funcional  que  aparece  en  (7.37).  Multiplicando  (7.39)  con 
un  factor  2 L (lo  que  supone  que  L / 0,  o sea,  para  métricas  lorentzianas  que  la  geodésica  no  sea 
nula),  podemos  eliminar  la  raiz  cuadrada.  La  ecuación  (7.37)  se  escribe  entonces  como 


d (SL2\  SL2  _^8LdL 
dr  V Si **  ) Sx v-  Sx^  dr  ’ 

y rellenando  la  expresión  para  L obtenemos  para  el  lado  izquierdo 

d íSL2\  SL 2 d ( \ 

d¿(si¿)  ~s^  = d^(2(JlJ,/x  ) “ dp9vpX  x 

= 2,gpvxu  + 2 dpg,iVxvxp  - dpg„pxvxp 


(7.40) 


&vQ[ip  “t-  dpgvp  dpgifP  x xp 


— 2 g p\ 

donde  hemos  definido  los  símbolos  de  Christoffel  como 


A 

vp 


P 

pv 


= -nPX 
2 


Por  otro  lado,  el  lado  derecho  de  (7.40)  da 

„ SL  dL 


Síp  dr 


9P  {^pp9\v  “t~  8)i,gp\  dxgfiJ'j  • 
a 

9 9nuiv  d (ds^ 

•Jgpvx'lxv  dT\drJ 


- 2 L g^x1'  ^t2 

= 2gPvXL‘  (s/é). 


(7.41) 


(7.42) 


(7.43) 


Rellenando  las  dos  lados  en  (7.40)  y multiplicando  con  gafJ,l  vemos  que  la  ecuación  de  Euler- 
Lagrange  se  reduce  a 

xa  + { ^ | xvxp  = xa  (S/é).  (7.44) 

El  lado  derecho  de  esta  ecuación  depende  de  la  parametrización  de  la  curva,  lo  que  en  realidad  no 
tiene  significado  físico.  De  hecho,  eligiendo  una  parametrización  lineal  de  la  geodésica  métrica, 
s(t)  = r,  el  lado  derecho  es  cero  y la  ecuación  de  la  geodésica  es 

x°  + { ^ | xvxp  = 0.  (7.45) 


Para  métricas  lorentzianas  existen  tres  tipos  de  geodésicas:  temporales,  espaciales  y nulas, 
dependiento  si  la  distancia  entre  los  puntos  p y q es  temporal,  espacial  o nula.  En  el  caso  de  que 
la  geodésica  es  temporal,  el  parámetro  r tiene  la  interpretación  del  tiempo  propio  de  la  partícula 
que  viaja  a lo  largo  de  la  geodésica.  Si  la  geodésica  es  espacial  o nula,  el  paramétro  r no  tiene  un 
signifcado  físico  especial.  Para  distinguir  los  tres  casos  hay  que  añadir  a (7.45)  una  ecuación  más 
que  especifica  el  tipo  de  geodésica  a través  del  vector  tangente  a la  curva: 

!1  si  ^(t)  es  temporal, 

0 si  x^(t)  es  nulo,  (7-46) 

— 1 si  x^(t)  es  espacial. 
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7.6.  La  conexión  de  Levi-Civita 


Ya  hemos  dicho  antes  que  en  una  variedad  general  equipada  con  una  conexión  arbitraria,  la 
métrica  gp ,,  no  tiene  nada  que  ver  con  la  conexión  \pv.  Sin  embargo  no  es  difícil  de  demostrar  que 
en  cualquier  variedad  existe  una  conexión  única,  la  conexión  de  Levi-Civita , que  tiene  una  relación 
especial  con  la  métrica.  La  conexión  de  Levi-Civita  satisface  dos  condiciones: 

1.  La  conexión  es  simétrica:  TPJV  = Tpp. 

2.  La  derivada  covariante  de  la  métrica  es  cero:  'S/pg^p  = 0. 

La  primera  condición  implica  que  el  tensor  de  torsión  T ,p  es  cero  y por  lo  tanto  el  conmutador 
de  dos  derivadas  covariantes  viene  dado  sólo  por  el  tensor  de  Riemann: 

[Vp,V„}Vx  = RpUpxVp.  (7.47) 

La  segunda  condición  implica  que  el  producto  escalar  entre  dos  vectores  es  invariante  bajo  trans- 
porte paralelo  de  los  vectores, 

0 = u^V^pV'WP) 

= u^pgvpVvWp  + upgvpVpV''Wp  + PWP 

= (7.48) 

donde  up  es  el  vector  tangente  a la  curva  xp(r)  y en  la  última  igualdad  hemos  utilizado  que 
si  Vp  y Wp  son  transportados  paralelo  a lo  largo  de  la  curva,  up'Vp,V1'  = up\/pW1'  = 0.  La 
igualdad  (7.48)  claramente  sólo  puede  ser  verdad  para  cualesquieras  dos  vectores  Vp  y WM  y 
para  cualquier  curva  xp(t)  si  V/(y/,/p  = 0.  Las  conexiones  que  satisfacen  la  condición  \7 pgup  = 0 
son  compatibles  con  la  métrica.  Nótese  que  la  condición  de  compatibilidad  con  la  métrica  es  una 
condición  más  bien  física  que  matemática,  puesto  que  implica  que  la  norma  de  un  vector  no 
cambia  al  hacer  transporte  paralelo  a lo  largo  de  una  curva. 

La  segunda  condición  para  la  conexión  de  Levi-Civita  tiene  otras  ventajas:  el  hecho  que 
\7pgvp  = 0 implica  que  la  derivada  covariante  conmuta  con  subir,  bajar  o contraer  índices: 

g^pS^  = S7P{gpvSpv)  = VPSPP.  (7.49) 

Esta  propiedad  no  es  verdad  para  derivadas  covariantes  con  conexiones  que  no  sean  compatibles 
con  la  métrica. 

Dadas  estas  dos  condiciones,  la  conexión  queda  completamente  determinada  por  la  métrica. 
Considérese  las  tres  derivadas  covariantes  de  la  métrica: 

o ^ p.gvP  dpgUp  — r pi/g\p 

0 ^ PgPv  9pgpv  r ppg\i/  L p^g^x, 

o = = d„gpfl-r^pgxp-T^gpX.  (7.50) 

Si  sumamos  las  primeras  dos  expresiones  y le  restamos  la  tercera,  utilizando  el  hecho  que  tanto 
la  métrica  como  la  conexión  son  simétricas,  obtenemos 

dpgvp  + dPgPv  — d^gpp  — 2T  p^gx^  = 0,  (7.51) 

o,  resolviendo  para  r p , 

= 2#  (ppg<?a  + 9pgpcT  — d^gpi^j  • (7-52) 

Podemos  por  lo  tanto  expresar  la  conexión  de  Levi-Civita  completamente  en  función  de  las  com- 
ponentes de  la  métrica  y sus  derivadas.  En  otras  palabras,  la  métrica  determina  completamente  la 
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conexión  de  Levi-Civita  y por  lo  tanto  también  el  tensor  de  Riemann  y la  curvatura.  El  hecho  de 
que  la  conexión  de  Levi-Civita  sea  compatible  con  la  métrica  y completamente  determinada  por 
ésta,  hace  que  esta  conexión  juegue  un  papel  preferido  dentro  de  la  relatividad  general.  Además 
resulta  que  la  noción  de  transporte  paralelo  que  induce  la  conexión  de  Levi-Civita  es  la  que  más 
se  aproxima  a nuestra  intuición  de  paralelo  en  espacios  curvos. 

Estará  claro  que  las  dos  condiciones  que  determinan  la  conexión  de  Levi-Civita  (ausencia 
de  torsión  y compatibilidad  con  la  métrica)  simplifican  mucho  las  propiedades  geométricas  del 
espacio.  Para  empezar,  nótese  que  la  expresión  (7.52)  para  la  conexión  en  función  de  la  métri- 
ca coincide  exactamente  con  la  expresión  de  los  símbolos  de  Christoffel  (7.42)  que  aparece  en 
la  fórmula  de  las  geodésicas  métricas.  En  otras  palabras,  utilizando  la  conexión  de  Levi-Civita, 
coinciden  las  geodésicas  afines  con  las  geodésicas  métricas. 

Una  segunda  ventaja  de  la  conexión  de  Levi-Civita  es  que  los  tensores  de  curvatura  tienen 
más  simetrías  y satisfacen  relaciones  más  sencillas.  Ya  hemos  visto  en  (7.27)  que  el  tensor  de 
Riemann  es  antisimétrico  en  los  primeros  dos  índices,  pero  resulta  que  RpVpx  también  es  anti- 
simétrico en  las  últimas  dos  índices,  si  la  conexión  es  compatible  con  la  métrica 


R , 


pupX 


= - R 


/ iuXp • 


(7.53) 


Esta  ultima  propiedad  se  demuestra  fácilmente  calculando  el  conmutador  de  dos  derivadas  co- 
variantes actuando  en  la  métrica  g (ejerc.). 

Las  identidades  de  Bianchi  (7.29)  y (7.30)  se  reducen  con  la  conexión  de  Levi-Civita  a 


RpupX  4“  RuppX  4“  Rppv a 0, 

V pRupaX  + V uRppaX  + ^ pR  púa  A = 0.  (7-54) 

Las  reglas  de  antisimetría  (7.27)  y (7.53),  en  combinación  con  la  primera  identidad  de  Bianchi 
(7.54),  implican  que  el  tensor  de  Riemann  es  simétrico  bajo  el  intercambio  del  primer  par  de 
índices  con  el  segundo  par  (ejerc.), 

RpupX  — RpXpu  • (7.55) 

Estas  condiciones  reducen  el  número  de  grados  de  libertad  del  tensor  de  Riemann,  es  decir  el 
número  de  componentes  independientes.  Un  pequeño  cálculo  combinatorio  muestra  que  el  ten- 
sor de  Riemann  en  N dimensiones  tiene  -¡-tj  A2(A?2  — 1)  grados  de  libertad,  lo  que  en  N = 4 
corresponde  a 20,  lo  que  son  justo  las  20  derivadas  segundas  de  la  métrica  dpdugPx  por  lo  que  no 
tenemos  la  libertad  de  igualarlas  a cero. 

Utilizando  la  conexión  de  Levi-Civita,  está  claro  de  (7.33)  que  tanto  el  tensor  de  Ricci  RpU 
como  el  tensor  de  Einstein  Gpu  son  simétricos  en  los  dos  índices.  Fíjese  que  los  términos  de 
torsión  son  cero  por  la  simetría  de  la  conexión,  mientras  el  término  RpuPp  es  cero  debido  a la 
propiedad  (7.53),  es  decir,  debido  a la  compatibilidad  de  la  conexión  con  al  métrica. 

Una  de  las  propiedades  importantes  del  tensor  de  Einstein  para  la  relatividad  general  es  que 
su  divergencia  es  cero.  Contrayendo  (7.54)  con  gpa  y gllX  y utilizando  la  compatibilidad  con  la 
métrica,  obtenemos  una  relación  diferencial  entre  el  tensor  de  Ricci  y el  escalar  de  Ricci  (ejerc.) 

= \dvR.  (7.56) 

Ahora,  calculando  la  divergencia  de  G v vemos  que 

= g^p(Rvp  - \juPR ) = V;,ñUJ  - \duR  = 0.  (7.57) 

Esta  propiedad  jugará  en  importante  papel  en  la  construcción  de  las  ecuaciones  del  campo  gra- 
vitacional,  como  veremos  en  el  Capítulo  9. 
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Finalmente,  en  el  Capítulo  6 hemos  visto  que  en  cada  punto  existe  un  sistema  de  coordenadas, 
llamado  las  coordenadas  localmente  inerciales,  que  son  tales  que  la  métrica  en  ese  punto  tiene 
la  forma  de  una  métrica  plana,  salvo  efectos  de  segundo  orden.  Para  conexiones  simétricas,  se 
puede  demostrar  que  en  las  coordenadas  localmente  inerciales,  todas  las  Vf‘n,  son  cero  en  este 
punto,  aunque  no  sus  derivadas. 

Se  puede  construir  el  cambio  de  unas  coordenadas  arbitrarias  x/l  a coordenadas  localmente 
inerciales  ya  desde  las  reglas  (7.14).  Considera  el  cambio  de  coordenadas 

Va  = x*6Z  + \m^x\  (7.58) 

donde  M“„  son  TV 3 constantes  que  quedan  por  determinar.  Tomemos,  sin  pérdida  de  generalidad, 
como  el  origen  = 0 del  sistema  de  referencia  el  punto  p donde  queremos  construir  el  sistema 
localmente  inercial.  Bajo  este  cambio  de  coordenadas  la  conexión  transforma  en  el  punto  = 0 
como 

r2>)  = % % K KÁP)  m;v  6£  5%.  (7.59) 

Con  la  elección  apropiada  de  las  constantes  M“  = T £„(p)  podemos  conseguir  que  en  el 

punto  p la  conexión  en  las  coordenadas  y°  tengan  el  valor  T^(p)  = 0.  Nótese  que  el  cambio  de 
coordenadas  con  esta  elección  de  las  M“„  sólo  anula  la  conexión  en  el  punto  p.  Para  poder  anular 
la  conexión  en  un  punto  q^p  hará  falta  otra  elección  de  las  constantes,  es  decir,  M“„  = V £„(g) 

El  cambio  de  coordenadas  (7.58)  tampoco  es  capaz  de  anular  las  derivadas  de  la  conexión  en 
el  punto  p,  de  modo  que  en  este  punto  el  tensor  de  Riemann  en  coordenadas  ya  viene  dado  por7 

R«Pj5(p)  = dar %{p)  - d0T *».  (7.60) 

Por  lo  tanto,  aunque  la  métrica  se  puede  escribir  localmente  como  5ap  (ya0)  más  términos  de 
segundo  orden,  la  curvatura  no  es  cero.  Es  más,  son  precisamente  los  términos  de  segundo  orden 
los  que  dan  lugar  a los  términos  restantes  del  tensor  de  Riemann. 

De  la  fórmula  (7.58)  es  fácil  de  ver  por  qué  esta  propiedad  sólo  funciona  para  conexiones 
simétricas:  el  cambio  de  coordenadas  (7.58)  es  simétrico  en  en  los  índices  ¡i  y v,  de  modo  que  en 
(7.59)  el  cambio  de  coordenadas  sólo  podrá  deshacer  la  parte  simétrica  de  r£„.  Pero  también  hay 
otra  manera  de  verlo:  si  la  conexión  no  fuera  simétrica,  la  torsión  T?  = Pj),,  — r£  sería  diferente 
de  cero  en  un  sistema  de  coordenadas  arbitrario.  Pero  el  carácter  tensorial  de  la  torsión  impide 
que  en  este  caso  exista  un  sistema  de  coordenadas  específico  donde  la  torsión  (y  por  lo  tanto  la 
conexión)  sea  cero,  aunque  sea  en  un  punto.  La  única  posibilidad  para  poder  igualar  a cero  las 
conexiones  es  que  la  torsión  sea  cero,  es  decir,  cuando  la  conexión  sea  simétrica. 

El  hecho  de  que  la  conexión  de  Levi-Civita  esté  completamente  determinada  por  la  métrica 
y simplifique  mucho  las  identidades  satisfechas  por  los  tensores  de  curvatura,  hace  que  esta 
conexión  juegue  un  papel  preferido  dentro  de  la  relatividad  general.  En  el  Capítulo  9 veremos 
algunos  argumentos  que  justifican  el  uso  de  esta  conexión  a la  hora  de  hacer  física. 


7.7.  Operadores  diferenciales  en  variedades  arbitrarias 


Ya  que  hemos  construido  la  derivada  covariante  V/(  como  el  operador  que  transforma  como 
un  vector  bajo  cambios  generales  de  coordenadas,  tenemos  que  redefinir  los  operadores  diferen- 
ciales conocidos  de  E;i,  encontrados  en  el  Capítulo  4,  tal  que  también  sean  válidas  en  variedades 
arbitrarias. 

7Utilizaremos  el  símbolo  "="  para  indicar  que  una  igualdad  sólo  es  válida  en  un  sistema  de  coordenadas  específico, 
no  en  general. 
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Dado  que  la  derivada  covariante  actuando  de  un  escalar  coincide  con  la  derivada  parcial, 
V;,0  = dp(¡),  la  definición  del  gradiente  de  una  función  escalar  no  sufre  cambios  con  respecto  a la 
definición  en  M3 . 

Sin  embargo,  para  que  la  divergencia,  el  rotacional  y el  laplaciano  transformen  bien  bajo  cam- 
bios generales  de  coordenadas,  es  preciso  construir  estos  operadores  diferenciales  con  derivadas 
covariantes: 

V • A = VPAP,  (V  x Áy  = £»vpV„Ap,  V2</>  = V „&*<!>.  (7.61) 

Estas  definiciones  simplifican  bastante  si  la  conexión  es  la  de  Levi-Civita.  En  este  caso  se 
puede  escribir  el  rotacional  puramente  en  términos  de  derivadas  parciales,  ya  que  la  contracción 
de  la  conexión  simétrica  y el  tensor  de  Levi-Civita  antisimétrico  es  idénticamente  cero: 

(V  x Áy  = £p,vp  (dvAp  - T*pAx)  = £pvpdvAp.  (7.62) 

También  las  expresiones  para  la  divergencia  y el  laplaciano  son  más  sencillas.  De  la  misma  defini- 
ción (7.52)  de  la  conexión  de  Levi-Civita  se  puede  demostrar  con  el  uso  de  (A.23)  que  el  símbolo 
de  Christoffel  con  dos  índices  contraidos  se  puede  escribir  como  (ejerc.) 

= -j=  dpV\9\-  (7-63) 

Usando  esta  propiedad,  la  divergencia  de  un  vector  y el  laplaciano  de  un  escalar  toman  la  forma 

No  es  difícil  de  ver  que  esta  expresión  para  la  divergencia  es  incluso  válida  para  tensores  anti- 
simétricos: si  TP  l ■"/'r"  es  un  tensor  completamente  antisimétrico,  entonces  (ejerc.) 

v = _L (7-65) 

vlsi  L J 

Es  instructivo  ver  hasta  qué  punto  las  conocidas  identidades  de  las  diferentes  operadores  dife- 
renciales actuando  unos  sobre  otros  generalizan  de  Rw  (R3  en  caso  de  rotacionales)  a variedades 
arbitrarias.  Claramente,  la  divergencia  de  un  gradiente  sigue  siendo  el  laplaciano, 

V • (V0)  = Vpdp(j)  = V2(/>,  (7.66) 

básicamente  por  la  misma  definición  de  los  operadores.  El  caso  del  rotacional  de  un  gradiente 
también  es  bastante  directo: 

(VxV^f  = £^p\7^pc¡>  = ^£pup  [V„,  Vp]<¿>  = 0,  (7.67) 

por  lo  menos  en  el  caso  de  que  la  conexión  sea  Levi-Civita.  Obsérvese  que  si  hay  torsión,  el 
resultado  se  modifica  considerablemente. 

El  caso  de  la  divergencia  de  un  rotacional  es  un  poco  más  sútil: 

V • (V  x á)  = = i£^[VM,V„]Ap  = ^epvp  RpvpxAx  - 0,  (7.68) 

donde  en  la  última  igualdad  hemos  utilizado  la  identidad  de  Bianchi  (7.54)  en  el  caso  de  Levi- 
Civita.  También  aquí  se  modifica  el  resultado  en  presencia  de  torsión. 


'VWm]-  (7.64) 


V- A = 


fJyM  & 
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Finalmente  el  rotacional  de  un  rotacional  sí  da  un  resultado  distinto  cuando  hay  curvatura: 

(v  x v x Áy  = £^%Actvi,vaa<t 


= 9 ^ 


X?  \S7  VAV  + RvXavA° 


- S72A^ 


= V^vA"  - V2AM  - R.^Ao 


(7.69) 


donde  en  la  segunda  igualdad  hemos  usado  la  identidad  para  la  contracción  de  dos  tensores  de 
Levi-Civita, 

s^psXap  = 5»%  - « (7-70) 

El  rotacional  de  un  rotacional  tiene  por  lo  tanto  un  término  extra  con  respecto  al  resultado  en 
R3,  proporcional  al  tensor  de  Ricci,  a causa  del  intercambio  de  dos  derivadas  covariantes  en  la 
tercera  igualdad,  para  poder  escribir  el  primer  término  como  el  gradiente  de  una  divergencia. 

A estas  alturas  es  natural  preguntarnos  por  qué  la  identidad  (7.69)  depende  de  la  geometría 
del  espacio  considerado,  pero  (7.67)  y (7.68)  son  independientes  de  la  métrica.  La  respuesta  es 
relativamente  sencilla  si  recordamos  los  teoremas  de  Stokes  (1.25):  la  integral  de  un  rotacional  en 
una  superficie  S se  puede  escribir  como  la  integral  de  linea  sobre  la  curva  7 = dS  que  bordea  la 
superficie,  de  modo  que  para  nuestro  caso  tenemos  que 

i (V  x V0)  -ñd2x  = <£  V0  • dr.  (7.71) 

Js  JdS 

Sin  embargo  esta  última  expresión  es  cero,  por  lo  menos  en  espacios  simplemente  conexos  (es- 
pacios donde  todos  las  curvas  con  contraibles  a un  punto):  la  integral  de  linea  de  un  gradiente 
de  un  campo  es  igual  a la  diferencia  de  los  valores  el  campo  en  los  extremos  de  la  curva.  Pero  al 
ser  7 = dS  una  curva  cerrada,  la  integral  (7.71)  vale  cero.  Dicho  de  otra  manera:  en  un  espacio 
simplemente  conexo,  la  curva  7 = dS  se  puede  contraer  a un  solo  punto,  por  lo  que  la  integral 
no  puede  tener  un  valor  finito. 

Del  mismo  modo  el  teorema  de  Stokes  convierte  la  integral  de  volumen  V de  una  divergencia 
en  la  integral  en  la  superficie  S = d V que  rodea  el  volumen  V.  Si  entonces  la  divergencia  actúa 
sobre  un  rotacional,  tenemos  que 


í V • (V  x Á)  d3x  = í (V  x Á)  ■ d2x , (7.72) 

JV  JdV 

lo  que  a su  vez  por  el  teorema  de  Stokes  sería  la  integral  de  A sobre  la  curva  que  bordea  la 
superficie  S = 0 V . Sin  embargo,  al  ser  c)V  una  superficie  cerrada,  no  tiene  una  curva  7 = dS  = 
ddV  que  la  rodea  y la  integral  (7.72)  es  trivial. 

En  otras  palabras,  la  identidades  (7.67)  y (7.68)  son  propiedades  topológicas  de  espacios  sim- 
plemente conexos  y por  lo  tanto  no  dependen  de  la  geometría  (métrica)  del  espacio.  Son  manifes- 
taciones del  conocido  teorema  topológico  que  "la  frontera  de  una  frontera  es  cero".  Sin  embargo, 
para  construir  el  operador  V x V x A es  preciso  contraer  dos  tensores  de  Levi-Civita  a través  de 
la  métrica,  de  modo  que  aquí  sí  aparecen  la  propiedades  geométricos  del  espacio. 


7.8.  Ejemplo  concreto:  tensores  de  curvatura  de  la  §2 


Como  ejemplo  concreto  para  ilustrar  lo  que  hemos  visto  en  este  capítulo,  repasaremos  la  esfe- 
ra bidimensional  que  hemos  encontrado  en  el  Capítulo  6.  La  métrica  en  coordenadas  azimutales 
era 


ds 2 = Rq  ^ d6 2 + sin2  Odíp2'^ , 


(7.73) 
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donde  Rq  era  el  radio  de  la  esfera.  A través  de  la  fórmula  (7.52)  no  es  difícil  ver  que  los  símbolos 
de  Christoffel  no  nulos  son  (ejerc.) 

^ = Ke  = cotS  0.  Kv  = - sin  9 cos  d>  (7-74) 

y por  lo  tanto  las  componentes  no-triviales  del  tensor  de  Riemann  vienen  dadas  por  (ejerc.) 

Rgipd^  = — Ripee v = — 1,  Re<p<p 6 = —RipOip6  — sin2  9.  (7-75) 

Según  la  fórmula  de  la  sección  7.6,  el  tensor  de  Riemann  completamente  covariante  tiene  en  dos 
dimensiones  sólo  una  componente  independiente.  Efectivamente,  de  (7.75)  se  ve  fácilmente  que 
(ejerc.) 

Revecp  = -R-o  sin2  9 , (7.76) 

y que  todas  las  demás  componentes  están  relacionadas  con  esta  a través  de  las  fórmulas  (7.27), 
(7.53)  y (7.55).  El  tensor  de  Ricci  se  puede  obtener  o bien  a través  de  la  contracción  del  tensor  de 
Riemann,  o bien  a través  de  la  fórmula  (7.32).  Las  componentes  no-triviales  son  (ejerc.) 

Ree  = — 1,  Rvv>  = - sin2  9,  (7.77) 

y por  lo  tanto  el  escalar  de  Ricci  viene  dado  por 

R = —2Rq2.  (7.78) 


La  esfera  bidimensional  (igual  que  las  demás  esferas  en  otras  dimensiones)  es  un  espacio  con 
mucha  simetría  y esto  se  refleja  en  sus  tensores  de  curvatura.  Obsérvese  que  la  expresión  (7.7 6)  y 
las  demás  componentes  relacionadas  se  pueden  resumir  en  la  expresión 

RpupX  Rq  {^9p\9vp  QppQv x*J  ■ (7.79) 

En  el  Capítulo  12  veremos  que  esta  es  la  definición  de  los  espacios  con  curvatura  constante, 
o,  equivalentemente,  los  espacios  máximamente  simétricos.  Contrayendo  (7.79)  se  obtiene  una 
expresión  parecida  para  el  tensor  de  Ricci, 

Rp,v  = (7.80) 


que  efectivamente  es  una  condición  que  satisfacen  las  componentes  encontrados  en  (7.77). 

Es  instructivo  hacer  el  mismo  cálculo  utilizando  en  la  esfera  las  coordenadas  estereográficas 
(6.36), 


ds2  = 


4 Rt 


(Rq  + r2)2  L 


dr2 


r2dip 2 


(7.81) 


En  estas  coordenadas  los  símbolos  de  Christoffel  vienen  dados  por  (ejerc.) 


r 


r 

rr 


-2  r 


_ pv 

x ípr  L r<*p 


Rl-r2 
r(Rl  + r2Y 


-r(Rl  - r2) 
R20+r2 


(7.82) 


Obsérvese  que  estas  expresiones  son  muy  diferentes  de  las  expresiones  (7.6)  para  E2  en  coorde- 
nadas polares  y (7.74)  para  la  S2  en  coordenadas  estándar  respectivamente.  En  particular  vemos 
que  en  estas  coordenadas  hay  una  componente  no-trivial  más  que  en  los  otros  dos  casos,  debido 
a que  los  símbolos  de  Christoffel  no  transforman  como  un  tensor.  Utilizando  estas  expresiones, 
no  es  muy  difícil  calcular  los  tensores  de  curvatura.  Para  el  tensor  de  Riemann  tenemos  que 


R v — 

J-  V'píp'p 


~4  R2 

(Rq  + r2)2  ’ 


Rrcptp 


4f?g  r2 
(Rq  + r2)2  ’ 


R 


ríprcp 


— 16f?g  r2 

(Rl  +r2)4’ 


(7.83) 
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mientras  que  el  tensor  y el  escalar  de  Ricci  son  de  la  forma 


-4ñn 


(. flg  + r 2)2' 


_ -4R0  r2 
^ (í?q  + r2)2  ’ 


R = — 2í?q. 


(7.84) 


Nótese  que  también  en  estas  coordenadas  los  tensores  de  curvatura  satisfacen  las  identidades 
(7.79)  y (7.80).  Lógico,  puesto  que  (7.79)  y (7.80)  son  expresiones  covariantes:  si  son  válidas  en  un 
sistema  de  referencia,  también  lo  son  en  todos  los  demás. 

Por  último,  se  podrían  haber  sacado  las  expresiones  anteriores  directamente  a través  de  las 
reglas  de  transformación  de  los  tensores.  Dada  la  relación  (6.34)  entre  9 y r,  tenemos  que 


d9 

dr 


—2Rq 

i?o  + r2 


(7.85) 


y por  lo  tanto  los  tensores  de  curvatura  transforman  como 

r(-l)  = 


de  ae 

Rrr  — ~ ~ Rq9  — 


4 Rl 


dr  dr 


{Rl  + 

— 4f?0  i'2 


,2\2  ' 


^4  R2 

(Rl  + r2)2  ’ 


^ 0 - (i?2+r2)2’ 


R - ™?!Lr 

riprv  drdr  ^ ~ (ñ2+r2)2 


AR2°  (-Rl  sin2  9)  = WR6°r2 


( Ro+r 2)4' 


(7.86) 


115 


116 


Parte  III 

Relatividad  General 


117 


118 


Capítulo  8 

El  Principio  de  Equivalencia 


Pero  yo,  que  he  hecho  la  prueba,  te  puedo  asegurar,  Simplicio,  que  una  bala  de  cañón,  pesando 
cien  o doscientas  libras,  o incluso  más,  llegará  al  suelo  no  adelantando  más  que  un  palmo  a 
una  bala  de  mosquete  pesando  sólo  media  libra,  dado  que  ambos  caen  desde  una  altura  de  200 
codos. 

(G.  Galilei,  en  forma  del  personaje  de  Salviati  en  Discorsi  e Dimostrazioni  Matema- 
tiche,  intorno  a due  nuove  scienze,  1638) 


8.1.  Masa  gravitatoria  y masa  inercial 

En  el  Capítulo  2 hemos  dicho  que  el  origen  de  la  relatividad  especial  data  del  siglo  XVII,  cuan- 
do Galileo  Galilei  formuló  su  Principio  de  la  Relatividad.  De  cierta  manera  también  las  raices  de 
la  relatividad  general  remontan  a esa  época.  Es  a partir  de  allí  cuando  personas  como  Galilei  y Si- 
món Stevin  (1548  - 1620)  empezaban  a darse  cuenta  de  que  la  velocidad  que  alcanzan  los  objetos 
en  caída  libre  es  independiente  de  la  masa  de  los  objetos,  en  contraste  con  la  intuición  cotidiana 
y la  física  aristotélica.  Es  legendario  (pero  históricamente  falso)  el  experimento  de  Galilei,  donde 
dejó  caer  bolas  de  distinta  masa  de  la  Torre  de  Pisa  para  observar  que  llegan  al  suelo  simultá- 
neamente. En  realidad  Galilei  sacó  sus  conclusiones  sobre  la  caída  libre  de  dejar  rodar  bolas  de 
planos  inclinados  y lo  publicó  en  su  libro  De  motu  en  1590.  El  que  sí  subió  a la  torre  de  la  cate- 
dral de  Delft  para  dejar  caer  las  masas  fue  el  ingeniero  y científico  flamenco  Simón  Stevin,  que 
escribió  ya  en  1586  en  su  libro  Weeghconst: 

"Deja  caer  dos  bolas  de  plomo,  una  diez  veces  más  grande  y más  pesada  que  la  otra,  [...]  juntas,  desde 
una  altura  de  30  pies,  encima  de  una  tabla  de  madera  [...]  y resultará  que  la  más  ligera  no  tardará  diez 
veces  más  que  la  pesada  en  recorrer  el  camino,  sino  que  caerán  tan  juntos  encima  de  la  tabla  que  los 
sonidos  de  ambas  parezcan  un  solo  golpe." 

La  universalidad  de  la  caída  libre  , el  hecho  de  que  la  velocidad  de  objetos  en  caída  libre  sea 
independiente  de  su  masa,  es  una  manifestación  de  una  coincidencia  remarcable  en  la  mecánica 
newtoniana:  la  igualdad  entre  la  masa  inercial  m¡  y la  masa  gravitatoria  mg. 

En  la  mecánica  newtoniana  aparecen  dos  tipos  de  masas,  en  distintos  contextos  y de  distintos 
tipos.  La  primera  es  la  masa  inercial  mi,  que  aparece  en  la  segunda  ley  de  Newton  como  constante 
de  proporcionalidad  entre  la  fuerza  F ejercida  en  un  cuerpo  y su  aceleración  a: 

F = m¡  a.  (8.1) 
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Figura  8.1:  Masa  inercial  y masa  gravitacional:  La  frecuencia  de  oscilación  u¡  de  un  cuerpo  colgado  de  un 
muelle  depende  de  la  masa  inercial  m¡  del  cuerpo,  mientras  la  extensión  AL  del  muelle  en  la  posición  de 
equilibrio  depende  de  la  masa  gravitacional  mg. 


La  masa  inercial  es  por  lo  tanto  una  medida  para  la  resistencia  de  un  cuerpo  contra  cambios  de 
velocidad,  en  otras  palabras,  su  inercia.  Por  otra  parte,  la  masa  gravitacional  mg  es  una  medida 
de  cómo  interaciona  un  cuerpo  gravitacionalmente  con  los  demás  cuerpos  en  el  universo.  El 
potencial  gravitatorio  causado  por  un  cuerpo  sobre  otro  cuerpo  viene  dado  por 


V = 


Gn  mgMg 
r 


(8.2) 


donde  Gn  es  la  constante  de  Newton  y r la  distancia  entre  las  dos  masas  mg  y Mg. 

A priori  estas  dos  cantidades  físicas  no  tienen  nada  que  ver  una  con  la  otra  y las  distintas 
maneras  de  medir  la  masa  de  un  cuerpo  miden  en  realidad  una  de  estas  dos  posibilidades,  de- 
pendiendo del  experimento.  Por  ejemplo,  colgando  una  masa  de  un  muelle  con  constante  de 
elasticidad  k,  la  ecuación  de  movimiento  de  la  masa  viene  dada  por  la  segunda  ley  de  Newton 


kx  = m¡x;  (8-3) 

de  modo  que  midiendo  la  frecuencia  jj  = obtenemos  la  masa  inercial.  Sin  embargo,  en  la 

posición  de  equilibrio,  la  fuerza  del  muelle  está  compensada  por  la  fuerza  gravitacional1 


kAL  = mgg , (8-4) 

donde  g es  la  aceleración  gravitatoria  y AL  = mgg/k  el  desplazamiento  de  la  longitud  de  reposo 
del  muelle.  Por  lo  tanto,  el  desplazamiento  AL  nos  da  una  medida  para  la  masa  gravitacional 
(Véase  Figura  8.1). 

El  hecho  de  que  todos  los  cuerpos  caigan  con  la  misma  velocidad  implica  que  hay  una  relación 
entre  estos  dos  tipos  de  masas.  Efectivamente,  la  ecuación  de  movimiento  de  una  masa  en  caída 
libre  viene  dada  por  la  segunda  ley  de  Newton,  donde  F es  la  fuerza  de  la  gravedad  galileiana 

— ?ng  g = m¡x.  (8-5) 


En  general  la  solución  de  esta  ecuación  es  de  la  forma 


x{t) 


1 mg  o 

--x—gt  + vot  + x0, 

2 m¡ 


(8.6) 


donde  Vq  y xq  son  constantes  de  integración  determinadas  por  las  condiciones  iniciales.  Pero  si 
queremos  explicar  por  qué  dos  cuerpos  con  distintas  masas  (inerciales  y gravitacionales)  y con 

'Aquí  consideraremos  la  gravedad  galileiana,  es  decir  un  campo  gravitatorio  constante,  cerca  de  la  superficie  de  la 
Tierra. 
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las  mismas  condiciones  iniciales  llegan  a la  vez  al  suelo,  tenemos  que  asumir  que 

Tíl 

— - = constante.  (8.7) 

m¡ 

En  principio  podría  ser  que  esta  constante  dependiera  del  material,  de  modo  que  una  bola  de 
acero  cayera  más  rápido  o más  lento  que  una  bola  de  madera.  Sin  embargo,  los  experimentos 
enseñan  que  mg/m¡  es  una  constante  universal  (independiende  del  material),  que  se  puede  tomar 
1 con  la  apropiada  elección  de  unidades.2 

Efectivamente,  en  una  serie  de  experimentos  históricos  se  ha  comprobado  la  igualdad  de  masa 
inercial  y masa  gravitacional  hasta  gran  precisión.  En  1888  el  barón  húngaro  Lóránd  von  Eótvós 
(1848  - 1919)  inventó  una  balanza  de  torque  que  midió  la  diferencia  entre  el  valor  de  rng/m¡  de 
dos  cuerpos,  utilizando  la  gravedad  y la  rotación  diaria  de  la  Tierra  como  medida  para  ?ng  y rn¡ 
respectivamente,  alcanzando  una  precisión  de  |mg  — mi|/mg  < 10-9.  En  1964  el  americano  Robert 
Dicke  (1916  - 1997)  aumentó  la  precisión  del  experimento  a |mg  — mi|/mg  < 10~n,  utilizando  la 
gravedad  y la  rotación  alrededor  del  Sol.  Los  límites  experimentales  actuales  son  del  orden  de 
3 • 10-13,  mientras  hay  planes  para  experimentos  en  satélites  que  llegarían  a una  precisión  de 
1CT18.  Veremos  ahora  como  el  Principio  de  Equivalencia  explica  esta  igualdad  de  masa  inercial  y 
gravitatoria  de  una  manera  muy  natural. 


8.2.  El  Principio  de  Equivalencia  para  campos  homogéneos 


Ya  hemos  dicho  en  la  sección  5.4  que  Einstein  ya  en  1907  se  dio  cuenta  de  que  la  teoría  de  la 
relatividad  especial  era  necesariamente  incompatible  con  la  gravedad  newtoniana,  por  ser  ésta 
última  una  interacción  inmediata  y a distancia.  Sin  embargo  no  estaba  claro  cómo  se  podía  incor- 
porar la  gravedad  en  la  relatividad  especial,  puesto  que  intrínsicamente  trataba  con  observadores 
acelerados,  por  los  cuales  el  Principio  de  la  Relatividad  no  es  válido. 

Por  otro  lado,  a Einstein  le  impresionó  mucho  la  igualdad  de  la  masa  inercial  y la  masa  gra- 
vitatoria. Aunque  la  mecánica  newtoniana  no  daba  ninguna  razón  a priori  por  la  que  estas  dos 
cantidades  físicas  tuvieran  el  mismo  valor,  Einstein  creía  que  esto  no  podía  ser  casualidad,  sino 
que  insinuaba  una  profunda  propiedad  de  la  Naturaleza. 

La  luz  vino  en  1907,  en  lo  que  Einstein  mismo  llamó  "la  idea  más  feliz  de  mi  vida",  cuando 
se  dio  cuenta  de  que  un  observador  en  caída  libre  no  siente  su  propio  peso  y por  lo  tanto  podría 
pensar  que  estuviera  en  una  región  del  espacio  donde  no  hubiera  campo  gravitatorio.  Efectiva- 
mente, una  bola,  soltada  por  el  observador  durante  la  caída  libre,  caerá  debido  a la  universalidad 
de  la  caída  libre  a la  misma  velocidad  que  el  propio  observador,  de  modo  que  este  último  verá  la 
bola  flotando  como  si  estuviera  en  el  espacio  interestelar  (véase  Figura  8. 2). 3 Por  lo  tanto,  un  ob- 
servador en  caída  libre  en  un  campo  gravitacional  constante,  aunque  no  es  un  observador  inercial 
en  el  sentido  newtoniano,  podría  considerarse  a sí  mismo  en  reposo. 


Principio  de  Equivalencia  (para  campos  gravita  torios  constantes):  Un  observador  en 
caída  libre  en  un  campo  gravitatorio  constante  es  equivalente  a un  observador  inercial  en 
ausencia  de  gravedad.  Es  imposible  determinar  la  diferencia  entre  estas  dos  situaciones  a base 
de  experimentos  físicos. 


2En  la  segunda  mitad  de  los  1980  parecía  haber  indicios  (aunque  contradictorios)  de  que  podría  existir  una  quinta 
fuerza  fundamental,  aparte  de  la  gravedad,  el  electromagnetismo  y las  interacciones  fuerte  y débil.  La  quinta  fuerza 
supuestamente  actuarla  de  modo  repulsivo  a una  escala  entre  100  y 1000  metros  y de  manera  diferente  en  objetos  de 
materiales  diferentes.  Un  análisis  profundo  de  los  experimentos,  sin  embargo,  ha  mostrado  que  en  realidad  no  existe  tal 
fuerza. 

3Nótese  que  esto  es  en  realidad  la  razón  por  la  que  un  astronauta  no  tiene  peso  en  una  órbita  alrededor  de  la  Tierra: 
porque  está  continuamente  en  calda  libre  alrededor  de  la  Tierra. 
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Figura  8.2:  Un  observador  en  caída  libre  es  (localmente)  equivalente  a un  observador  en  ausencia  de  campo 
gravitatorio.  No  hay  un  experimento  físico  que  pueda  distinguir  (¡localmente!)  entre  estos  dos  casos. 


Figura  8.3:  Un  observador  en  un  ascensor  acelerado  con  aceleración  constante  es  equivalente  a un  obser- 
vador en  reposo  en  un  campo  gravitacional  constante.  No  hay  un  experimento  físico  que  pueda  distinguir 
(¡localmente!)  entre  estos  dos  casos. 


Por  otro  lado,  un  observador  O'  en  un  ascensor  que  está  acelerado  en  el  espacio  interestelar 
con  una  aceleración  constante  a verá  los  mismos  efectos  que  vería  un  observador  en  un  campo 
gravitacional  constante.  En  particular,  si  O'  suelta  una  bola  desde  un  punto  xq  en  el  momento 
t,  cuando  el  ascensor  tiene  una  velocidad  v (con  respecto  a un  observador  externo  O),  la  bola 
seguirá  por  inercia  una  trayectoria  x(t)  = xq  + vt  (con  respecto  a O),  dado  que  el  ascensor  ya 
no  ejerce  ninguna  fuerza  sobre  ella.  Sin  embargo,  el  ascensor  seguirá  acelerando,  de  modo  que 
la  trayectoria  de  éste  viene  dada  por  X(t)  = vt  + ^ at 2 en  las  coordenadas  de  O.  Mientras  las 
velocidades  relativas  entre  O y O'  son  pequeñas  (y  por  lo  tanto  t ss  t ')f  vemos  que  la  trayectoria 
de  la  bola  en  las  coordenadas  de  O'  viene  dada  por 

x'(t)  = x(t)  — X(t)  = xo  — ^at2.  (8.8) 

En  otras  palabras,  para  O'  es  como  si  la  bola  cayera  en  un  campo  gravitatorio  con  aceleración 
gravitacional  g = —a  (véase  Figura  8.3).  Por  lo  tanto,  un  observador  moviéndose  con  aceleración 
constante,  aunque  no  sea  un  observador  inercial  en  el  sentido  newtoniano,  se  podría  considerar 
en  reposo  en  un  campo  gravitatorio. 


Principio  de  Equivalencia  (para  aceleraciones  constantes):  Un  observador  en  movi- 
miento uniformamente  acelerado  es  equivalente  a un  observador  inercial  en  un  campo  gravi- 
tatorio constante.  Es  imposible  determinar  la  diferencia  entre  estas  dos  situaciones  a base  de 
experimentos  físicos. 

4Para  una  derivación  del  caso  general  relativista,  referimos  a las  notas  de  G.  't  Hooft,  Introduction  to  General  Relati- 
vity. 
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Nótese  que  para  O la  bola  choca  con  el  suelo  del  ascensor  porque  el  suelo  alcanza  la  bola,  al  no 
estar  acelerada  esta  última,  mientras  O'  explica  el  mismo  fenómeno  diciendo  que  la  bola  siente 
un  campo  gravitatorio  constante.  Lo  que  para  O es  inercia,  para  O'  es  gravedad.  Esto  explica  la 
universalidad  de  la  caída  libre  y el  hecho  de  que  no  haya  distinción  entre  masa  inercial  y masa 
gravitatoria:  dos  bolas,  aunque  tengan  masas  distintas  o estén  hechas  de  materiales  distintos, 
alcanzarán  la  misma  velocidad,  puesto  que  siempre  se  podría  considerar  que  en  lugar  de  estar 
en  el  campo  gravitatorio  de  la  Tierra,  la  Tierra  se  estaría  acelerando  con  una  aceleración  a = 
9, 81m/s2  hacia  arriba. 

En  realidad  también  se  puede  dar  la  vuelta  al  Principio  de  Equivalencia  y decir  que  la  fuerza 
gravitatoria  en  realidad  no  es  más  que  un  artefacto  de  una  elección  de  unas  coordenadas  es- 
pecíficas. Efectivamente,  la  ecuación  de  movimiento  de  una  partícula  en  caída  libre  en  un  campo 
gravitatorio  constante  viene  dado  por  la  segunda  ley  de  Newton 

x = -g.  (8.9) 

Sin  embargo,  por  el  Principio  de  Equivalencia  podríamos  coger  el  punto  de  vista  de  un  observa- 
dor en  caída  libre  a través  del  cambio  de  coordenadas 

y = x+^gt2,  (8.10) 

de  modo  que  en  las  coordenadas  nuevas  la  ecuación  de  movimiento  de  la  partícula  viene  dada 
por 

y = 0.  (8.11) 

Vemos  por  lo  tanto  que  en  las  coordenadas  y la  ecuación  de  movimiento  corresponde  a la  de  una 
partícula  libre.  La  fuerza  gravitatoria  ha  sido  eliminada  por  el  cambio  de  coordenadas  (8.10).  Las 
fuerzas  que  dependen  del  sistema  de  referencia  y que  desaparecen  en  los  cambios  de  coorde- 
nadas, se  suelen  llamar  en  la  mecánica  clásica  una  fuerza  ficticia,  como  la  fuerza  centrífuga  o la 
fuerza  de  Coriolis.  Lo  que  nos  está  diciendo  el  Principio  de  Equivalencia  es  que  la  gravedad  no  es 
una  fuerza  física,  sino  un  artefacto  del  sistema  de  referencia.  El  cambio  de  coordenadas  (8.10)  sin 
embargo  no  es  una  transformación  ortogonal,  como  las  transformaciones  de  Lorentz,  en  realidad 
ni  siquiera  es  una  transformación  lineal.  Es  un  cambio  general  de  coordenadas,  como  los  que 
hemos  estudiado  en  los  Capítulos  6 y 7 y la  ecuación  de  movimiento  (8.11)  no  es  la  ecuación  de 
una  partícula  libre  en  coordenadas  cartesianas,  sino  en  curvilíneas.  Parece  por  lo  tanto  que  coor- 
denadas curvilíneas  son  de  cierta  manera  más  naturales  para  describir  objetos  en  caída  libre,  ya 
que  se  ha  eliminado  con  ellas  la  fuerza  de  la  gravedad.  Veremos  un  poco  más  adelante  que,  una 
vez  que  demos  el  paso  más  allá  de  campos  gravitatorios  constantes,  lo  más  natural  no  son  tanto 
las  coordenadas  curvilíneas,  sino  directamente  los  espacios  curvos. 


8.3.  El  Principio  de  Equivalencia  para  campos  inhomogéneos 

Hasta  ahora  hemos  tenido  mucho  cuidado  al  considerar  solamente  campos  gravitatorios  cons- 
tantes, es  decir  gravedad  galileiana.  Pero  un  campo  gravitatorio  constante  en  realidad  es  una 
aproximación  que  sólo  es  válida  en  regiones  pequeñas,  cerca  de  la  superficie  de  objetos  grandes, 
como  la  Tierra.  En  campos  gravitatorios  inhomogéneos,  la  equivalencia  entre  observadores  en 
caída  libre  y observadores  inerciales  ya  no  es  válida,  ya  que  observando  con  suficiente  precisión, 
un  observador  en  caída  libre  vería  que  dos  bolas  se  acercan  lentamente  según  vayan  cayendo 
cada  vez  más  hacía  el  centro  de  la  Tierra,  una  cosa  que  un  observador  inercial  en  el  espacio  in- 
terestelar no  vería.  Del  mismo  modo  un  observador  en  un  ascensor  acelerado  no  vería  las  bolas 
acercarse  como  en  el  campo  gravitatorio  terrestre  a distancias  no  muy  pequeñas  (véase  Figura 
8.4). 

Los  efectos  que  nota  un  observador  en  un  campo  gravitacional  inhomogéneo  se  llaman  fuer- 
zas de  marea  y son  justo  estos  efectos  los  que  hacen  que  un  observador  distinga  entre  un  sistema 
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Figura  8.4:  Los  efectos  de  marea:  el  Principio  de  Equivalencia  sólo  es  valido  localmente,  a escalas  pequeñas. 
A escalas  más  grandes  se  puede  ver  la  diferencia  entre  gravedad  y aceleración  a través  de  las  fuerzas  de 
marea,  debido  a la  inhomogenidad  del  campo  gravitacional. 


inercial  y un  sistema  acelerado.  Sin  embargo  estas  fuerzas  de  marea  son  pequeñas  a escalas  pe- 
queñas, ya  que  son  proporcionales  al  gradiente  del  campo  gravitatorio.  Por  lo  tanto,  a escalas  tan 
pequeñas  que  el  campo  gravitatorio  parece  localmente  constante,  el  Principio  de  Equivalencia 
vuelve  a recuperar  su  validez. 


Principio  de  Equivalencia  (formulación  general):  Observadores  en  caída  libre  en  un 
campo  gravitatorio  son  localmente  equivalentes  a observadores  inerciales.  No  hay  experimen- 
tos locales  que  puedan  distinguir  entre  estas  dos  situaciones. 


La  pregunta  que  entonces  surge  de  inmediato  es  ¿cuál  es  esa  escala  a partir  de  la  que  el  Prin- 
cipio de  Equivalencia  pierde  su  validez?  ¿A  qué  se  refiere  exactamente  con  experimentos  locales? 
Básicamente  el  Principio  de  Equivalencia  es  válido  mientras  que  los  efectos  de  marea  sean  inde- 
tectables.  Ya  hemos  dicho  que  los  efectos  de  marea  son  proporcionales  al  gradiente  del  campo 
gravitacional:  los  efectos  serán  más  grandes  cerca  de  una  masa  puntual  que  lejos  de  ella.  Pero 
el  gradiente  del  campo  gravitacional  no  es  el  único  parámetro:  el  rango  de  validez  del  Principio 
de  Equivalencia  también  depende  de  la  precisión  de  los  experimentos  a nuestra  disposición.  Si 
se  tiene  unos  aparatos  con  un  error  experimental  AL,  se  verá  que  el  Principio  de  Equivalencia 
se  cumple  en  regiones  del  espaciotiempo  donde  el  gradiente  del  campo  gravitatorio  no  es  ma- 
yor que  (AL)-1.5  Al  obtener  aparatos  nuevos  con  una  precisión  más  alta,  la  región  de  validez  se 
reducirá  correspondientemente. 

A primera  vista  esto  parece  reducir  el  Principio  de  Equivalencia  a una  tautología:  en  regiones 
donde  no  soy  capaz  de  medir  nada,  no  veré  ningún  efecto.  Sin  embargo,  esto  no  es  cierto.  Uno 
se  podría  imaginar  perfectamente  una  teoría  donde  en  regiones  donde  los  experimentos  no  nota- 
ran ningún  gradiente  apreciable  en  el  campo  graviatatorio,  objetos  de  distinta  masa  y /o  distinta 
composición  cayesen  a velocidades  distintas.  De  hecho,  esto  es  lo  que  pasa  con  la  fuerza  electro- 
magnética: objetos  con  la  misma  carga  pero  con  masas  distintas,  como  el  protón  y el  núcleo  de 
deuterio,  aceleran  de  manera  distinta  en  un  campo  eléctrico.  Ambas  partículas  sienten  la  mis- 
ma fuerza  atractiva  por  tener  la  misma  carga  eléctrica,  pero  la  inercia  del  deuterio  es  dos  veces 
mayor  por  tener  el  doble  de  masa.  Sin  embargo  en  el  caso  de  la  gravedad,  la  "carga  gravitato- 
ria"  es  la  misma  masa  que  causa  su  inercia,  de  modo  que  la  aceleración  gravitatoria  de  todas  las 
partículas  es  la  misma,  independientemente  de  su  masa.  Esto  es  lo  que  hace  que  el  Principio  de 
Equivalencia  no  es  trivial,  sino  muy  profundo. 

El  hecho  de  que  localmente  un  observador  no  pueda  distinguir  entre  estar  en  caída  libre  en 
un  campo  graviatatorio  o ser  un  observador  inercial  interestelar  implica  que  existe  un  cambio 

5Con  regiones  pequeñas  del  espaciotiempo  queremos  decir  no  solamente  regiones  espaciales  pequeñas  (i.e.  ascensores 
de  tamaño  limitado),  sino  también  intervalos  de  tiempo  pequeños  en  comparación  con  el  tiempo  que  necesita  la  luz  para 
recorrer  una  distancia  en  que  el  gradiente  llegue  a ser  apreciable.  Un  efecto  de  marea  pequeño  podría  acumularse  en  un 
intervalo  de  tiempo  grande  y llegar  a ser  notable  de  esta  manera. 
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Figura  8.5:  La  gravedad  como  manifestación  de  la  curvatura  del  espacio.  Las  trayectorias  de  partículas 
libres  en  un  espacio  curvo  son  las  geodésicas  de  la  variedad.  Sin  embargo  un  observador  que  insiste  en 
utilizar  las  coordenadas  de  un  espacio  plano  se  ve  obligado  a invocar  fuerzas  de  gravedad  F ficticias  para 
describir  las  aceleraciones  observadas. 


de  coordenadas  que  hace  que  el  espaciotiempo  parezca  localemente  Minkowski.  Debido  a las 
inhomogeneidades  del  campo  gravitatorio,  el  cambio  de  coordenadas  será  distinto  en  cado  punto 
del  espaciotiempo  y en  general  no  será  posible  encontrar  una  transformación  tal  que  el  espacio 
entero  se  reduzca  al  espacio  de  Minkowski,  sólo  una  región  pequeña.  La  imagen  que  surge  por  lo 
tanto  es  la  de  un  espacio  que  en  cada  punto  es  localmente  plano  (Minkowski),  pero  globalemente 
no.  Esto  es  el  concepto  de  una  variedad  con  curvatura,  que  encontramos  en  el  Capítulo  6. 

Efectivamente,  el  espaciotiempo  de  la  relatividad  general  es  una  variedad  lorentziana  cuadri- 
mensional  con  curvatura  determinada  por  la  conexión  de  Levi-Civita,  donde  las  partículas  libres 
viajan  a lo  largo  de  las  geodésicas  de  la  variedad  curva.  Sin  embargo  si  uno  insiste  en  que  el  espa- 
cio es  plano  y descriptible  en  términos  de  coordenadas  cartesianas,  las  partículas  parecerán  sufrir 
aceleraciones,  por  lo  cual,  debida  a la  segunda  ley  de  Newton,  habrá  que  recurrir  a una  fuerza 
para  poder  explicar  estas  aceleraciones.  La  interpretación  relativista  por  lo  tanto  de  lo  que  en  la 
mecánica  newtoniana  son  la  fuerzas  gravitatorias,  es  justo  esto:  una  pseudo-fuerza  debido  al  uso 
de  un  sistema  de  coordenadas  "inapropiado"  (véase  Figura  8.5).  En  otras  palabras,  la  gravedad 
no  es  más  que  una  manifestación  de  la  curvatura  del  espaciotiempo.  La  gravedad  es  geometría. 

La  mejor  ilustración  de  la  diferencia  entre  estas  dos  maneras  de  pensar  es  la  interpretación  de 
la  ecuación  de  movimiento  de  una  partícula  en  un  campo  gravitatorio.  Donde  para  Newton  la 
partícula  obedece  la  segunda  ley  de  Newton 

F - 5^  = 0,  (8.12) 

m 

para  Einstein,  la  partícula  sigue  una  geodésica  en  el  espaciotiempo  curvo, 

SP  + T^pxvxp  = 0.  (8.13) 

En  otras  palabras,  lo  que  para  Newton  es  la  fuerza  gravita toria  a distancia  Fgiav/m,  es  para  Eins- 
tein un  término  puramente  geométrico,  Tppxvxp,  debido  al  uso  de  coordenadas  curvilineas. 

En  los  Capítulos  6 y 7 hemos  visto  que  en  cualquier  punto  de  una  variedad  existen  unas 
coordenadas,  las  coordenadas  localmente  inerciales,  tales  que  en  una  región  pequeña  alrededor 
de  este  punto  los  símbolos  de  Christoffel  son  cero  y la  métrica  se  reduce  a la  plana  en  primera 
aproximación.  Esta  propiedad  es  el  fundamento  matemático  del  Principio  de  Equivalencia:  el 
cambio  de  coordenadas  que  nos  lleva  de  las  coordenadas  originales  a las  localmente  inerciales  es 
el  que  elimina  el  campo  gravitatorio  y hace  que  un  observador  se  crea  (localmente)  inercial. 

El  hecho  de  que  el  cambio  de  coordenadas  (7.58)  entre  unas  coordenadas  arbitrarias  xJ'  y las 
coordenadas  localmente  inerciales  ya  sea  en  general  un  cambio  general  de  coordenadas,  implica 
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que  las  leyes  de  la  física  tienen  que  transformar  bien  bajo  un  grupo  más  grande  que  el  grupo  de 
Lorentz.  Efectivamente,  en  las  coordenadas  localmente  inerciales,  un  observador  tiene  todo  dere- 
cho a llamarse  un  observador  inercial  y por  lo  tanto  para  él  las  leyes  de  la  físcia  tendrán  la  forma 
de  las  leyes  de  la  relatividad  especial,  por  lo  menos  localmente.  Sin  embargo,  el  mismo  obser- 
vador podría  estudiar  los  fenómenos  físicos  en  cualquier  otro  sistema  de  coordenadas  y debería 
llegar  a las  mismas  leyes  de  la  física,  aunque  escritas  en  coordenadas  distintas.  Esta  observación 
nos  lleva  a otro  principio  básico: 


Principio  de  Covariancia:  Las  leyes  de  la  física  deben  tener  la  misma  forma  en  todos  los  sis- 
temas de  referencia.  Las  leyes  de  la  físcia  deben  por  lo  tanto  transformar  de  manera  covariante 
bajo  cambios  generales  de  coordenadas. 


En  la  práctica  esto  implica  que  una  ley  es  válida  en  general  si  es  válida  en  relatividad  especial 
y si  la  escribimos  de  manera  covariante,  es  decir,  en  función  de  objectos  que  transformen  bien  bajo 
cambios  generales  de  coordenadas.  En  particular,  sustituyendo  derivadas  parciales  por  derivadas 
covariantes  y la  métrica  por  una  métrica  general  g/lu.  Einstein  llegó  a esta  conclusión  en  1913, 
más  de  5 años  después  del  Principio  de  Equivalencia  y aún  así  no  lo  utilizó  en  sus  primeras 
formulaciones  de  la  relatividad  general,  porque  temía  que  no  diese  el  límite  newtoniano  correcto 
y violara  la  causalidad  y el  determinismo.6  Sólo  en  1915  vino  con  una  versión  de  las  ecuaciones 
de  Einstein  que  estaban  de  acuerdo  con  ambos  principios. 

En  las  siguientes  dos  secciones  de  este  capítulo  ilustraremos  el  Principio  de  Equivalencia  con 
dos  ejemplos  y deduciremos  de  manera  cualitativo  los  efectos  relativistas  más  importantes.  Vol- 
veremos en  más  detalle  a estos  efectos  en  el  Capítulo  10. 


8.4.  Experimentos  en  un  ascensor 

Volveremos  a la  comparación  de  un  observador  en  un  campo  gravitatorio  constante  y un 
observador  en  movimiento  uniformamente  acelerado.  Supondremos  que  el  campo  gravitatorio 
es  suficientemente  homogéneo  como  para  que  los  efectos  de  marea  sean  despreciables.  El  Prin- 
cipio de  Equivalencia  dice  entonces  que  no  existe  ningún  experimento  físico  que  sea  capaz  de 
distinguir  entre  los  estados  de  movimiento  de  los  dos  observadores.  En  todo  esta  sección  tam- 
bién supondremos  que  todas  las  velocidades  v y diferencias  de  velocidades  Av  sean  pequeñas  en 
comparación  con  la  velocidad  de  la  luz,  de  modo  que  en  primera  aproximación  no  nos  tenemos 
que  preocupar  por  las  correcciones  debido  a efectos  de  la  relatividad  especial.  Para  un  análisis 
más  profundo  referimos  a la  literatura. 

Concretamente,  consideramos  un  observador  O'  en  un  ascensor  que  se  mueve  con  una  acele- 
ración constante  a con  respecto  a un  observador  externo  O.  Los  dos  observadores  O y O'  estarán 
de  acuerdo  en  que  hay  una  aceleración  relativa  entre  ellos,  pero  no  se  pondrán  de  acuerdo  sobre 
quién  se  mueve  y quién  está  en  reposo.  O'  puede  insistir  en  que  él  no  está  en  movimiento,  sino 
en  reposo  en  el  campo  gravitatorio  con  aceleración  gravitacional  g = —a  y que  la  aceleración 
relativa  entre  los  dos  es  debida  a que  O está  en  caída  libre  en  ese  campo  gravitatorio.  Esta  es  la 
razón,  según  O',  por  la  que  O no  nota  la  fuerza  del  supuesto  campo  gravitatorio:  precisamente 
porque  está  en  caída  libre. 

Para  poder  mantener  la  afirmación  de  O'  de  que  está  en  reposo  en  un  campo  gravitatorio,  la 
física  que  vea  O'  y que  vea  un  observador  O " en  un  campo  gravitatorio  constante,  tiene  que  ser 
la  misma  en  el  sentido  de  que  cualquier  fenómeno  que  ve  uno  de  ellos,  también  lo  tiene  que  notar 
el  otro.  Examinaremos  algunos  de  estos  fenómenos. 

6En  particular  le  preocupaba  que  unas  ecuaciones  covariantes  no  determinan  por  completo  la  forma  de  la  métrica  a 
partir  de  unas  condiciones  iniciales  y tardó  más  de  dos  años  en  comprender  que  los  grados  de  libertad  no  determinados 
no  eran  físicas,  sino  que  corresponden  a la  libertad  de  elección  de  coordenadas. 
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Ya  lo  hemos  dicho  en  la  sección  anterior,  pero  merece  la  pena  volver  a mencionarlo  aquí.  Si  el 
observador  O'  en  el  ascensor  suelta  un  masa  en  el  momento  t = to  cuando  el  ascendor  tiene  una 
velocidad  v(to)  relativo  a O,  esta  masa  seguirá  moviéndose  con  la  velocidad  v(U¡),  independiente- 
mente del  ascensor.  Por  lo  tanto  el  observador  externo  O verá  que  el  fondo  del  ascensor  se  acerca 
al  objeto  soltado  con  una  velocidad  relativa  v(t)  = v(t0)  + at  y se  choca  con  la  masa  después  de  un 
tiempo  t = \J‘2a/h,  donde  h es  la  altura  dentro  del  ascensor  desde  la  cual  O'  ha  soltado  el  objeto. 
El  observador  O'  verá  el  mismo  fenómeno,  pero  lo  interpretará  de  manera  distinta.  Para  él,  la 
masa  se  mueve  de  manera  acelerada  hacia  abajo,  debido  a la  fuerza  gravitatoria.  El  tiempo  que 
tardan  distintas  masas  en  llegar  al  suelo  y las  velocidades  que  alcanzan  son  siempre  los  mismos. 
Para  O esto  está  claro  a base  de  la  inercia,  ya  que  una  vez  soltadas,  ya  no  actúa  ninguna  fuerza 
sobre  ellas.  Por  otro  lado  O'  concluye  que  el  tiempo  de  caída  y las  velocidades  alcanzadas  son 
independientes  de  la  masa  y la  composición  de  los  objetos  soltados,  presisamente  lo  que  observa 
también  el  observador  O"  en  un  campo  gravitacional.  Esto  no  sólo  explica  la  universalidad  de 
la  caída  libre,  sino  también  indica  que  la  gravedad  se  acopla  de  manera  universal  a toda  la  materia, 
independientemente  de  la  masa  o la  composición.  No  hay  manera  de  que  una  partícula  no  note 
la  gravedad,  en  contraste  con  el  electromagnetismo,  donde  una  partícula  neutra  no  interacciona 
con  los  campos  electromagnéticos. 

No  sólo  partículas  con  masa  están  afectadas  por  la  gravedad,  sino  también  la  luz.  Si  el  obser- 
vador O emite  una  señal  de  luz  que  entra  horizontalmente  por  el  lateral  del  ascendor  a una  altura 
h,  saldrá  la  luz  por  el  otro  lateral  a una  altura  h — \ at 2,  donde  t es  el  tiempo  que  necesita  la  señal 
en  atravesar  el  ascensor.  Para  O la  trayectoria  de  la  luz  es  una  recta,  ya  que  es  el  ascensor  el  que 
se  mueve  hacia  arriba.  Sin  embargo  el  observador  O'  verá  en  sus  propias  coordenadas  que  la  luz 
sigue  una  trayectoria  curva,  que  él  atribuirá  a la  presencia  de  campo  gravitatorio.  Una  primera 
predicción  por  lo  tanto  de  la  relatividad  general,  o mejor  dicho  del  Principio  de  Equivalencia, 
es  que  hay  una  desviación  de  la  luz  de  su  trayectoria  recta  en  presencia  de  gravedad.  Efectiva- 
mente un  observador  O " en  un  campo  gravitatorio  ve  la  luz  desviada  si  pasa  cerca  de  cuerpos 
masivos,  como  fue  comprobado  exprimementalmente  en  el  famoso  eclipse  solar  de  1919. 7 El  mis- 
mo fenómeno  es  responsable  para  los  efectos  de  las  lentes  gravitatorias  y las  cruces  de  Einstein 
observadas  en  imágenes  de  galaxias  lejanas. 

Otro  experimento  que  puede  hacer  el  observador  O'  en  el  ascensor  es  emitir  una  serie  de  pul- 
sos periódicos  con  perido  Te  desde  el  fondo  del  ascensor  hacia  el  techo.  El  observador  exterior  O 
verá  que  en  el  tiempo  At  entre  la  emisión  en  el  fondo  y la  detección  en  el  techo,  el  ascensor  ha 
adquerido  una  velocidad  adicional  Av  = aAt,  de  modo  que  hay  una  velocidad  relativa  entre  la 
fuente  en  el  momento  de  emisión  y el  detector  en  el  momento  de  detección,  lo  que  da  lugar  a un 
efecto  Doppler:  el  detector  verá  llegar  los  pulsos  con  una  frecuencia  más  baja  que  la  frecuencia  de 
emisión.  Este  mismo  efecto  lo  verá  también  O',  pero  el,  creyendo  que  está  en  un  campo  gravita- 
cional, dirá  que  el  efecto  Doppler  es  debido  al  hecho  de  que  la  luz  pierde  energía  al  salir  el  pozo 
potencial.  En  1960  y 1964  Robert  Pound  y Glen  Rebka  hicieron  una  verificación  experimental  en 
un  campo  gravitatorio  real,  confirmando  que  efectivamente  un  efecto  Doppler  gravitacional  existe, 
tal  como  lo  predice  el  Principio  de  Equivalencia.  La  luz  que  escapa  de  un  campo  gravitatorio 
sufre  un  corremiento  hacia  el  rojo,  mientras  la  luz  que  entra  en  un  pozo  potencial  gravitacional 
un  corremiento  hacia  el  azul. 

Se  puede  hacer  fácilmente  una  estimación  del  efecto  en  primera  aproximación.  El  emisor  emi- 
te la  primera  señal  en  el  momento  t = 0 y llega  en  el  momento  t = At,8  de  modo  que  la  señal  en 

7Einstein  hizo  una  primera  estimación  del  efecto  de  la  desviación  de  la  luz  cerca  del  sol  en  1911,  basado  puramente 
en  el  Principio  de  Equivalencia,  obteniendo  una  deflexión  de  0,83  arcosegundos.  Se  hicieron  intentos  de  medir  el  efecto 
en  eclipses  solares  en  Brasil  en  1912  y en  Rusia  en  1914,  pero  fracasaron  debido  al  mal  tiempo  y el  estallido  de  la  Primera 
Guerra  Mundial.  En  1915  Einstein  volvió  a calcular  el  efecto,  ahora  en  base  a las  ecuaciones  de  Einstein  completas  y se 
dio  cuenta  de  que  el  resultado  verdadero  es  una  desviación  de  1,7  arcosegundos,  el  doble  de  su  primera  estimación.  Fue 
este  resultado  el  que  fue  confirmado  en  el  eclipse  de  1919  y que  dio  a Einstein  su  fama  mundial.  Uno  sólo  puede  adivinar 
lo  que  habría  pasado  si  las  expediciones  de  1912  y 1914  no  hubieran  tenido  la  mala  suerte  que  tuvieron. 

8 Estrictamente  hablando,  el  tiempo  t corresponde  al  tiempo  del  observador  externo  O,  pero  para  velocidades  pe- 
queñas en  comparación  con  la  velocidad  de  la  luz,  la  diferencia  entre  el  tiempo  de  O’  y O es  depreciable. 
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este  tiempo  ha  viajado  una  distancia 


Ai  = h + -a(At)2,  (8-14) 

donde  h es  la  altura  del  ascensor,  es  decir,  la  distancia  entre  el  emisor  y el  detector  en  reposo.  De 
(8.14)  podemos  calcular  una  expresión  para  A t en  función  de  h y a: 

Ai  = i(l-\/l-2a/i)  « h,  (8.15) 

donde  en  la  última  igualdad  hemos  supuesto  que  ah  <C  1 y desarrollado  la  raíz  cuadrada  en  un 
desarrollo  de  Taylor,  quedándonos  sólo  con  el  primer  orden.9  Físicamente  esto  corresponde  al 
hecho  de  que  la  aceleración  es  suficientemente  pequeña  para  que  el  cambio  de  velocidad  Av  en 
el  intervalo  de  tiempo  Ai  sea  despreciable.  En  el  momento  i = Te  el  emisor  emite  la  segunda 
señal,  que  llega  al  detector  en  el  momento  Ai  + Td.  (En  otras  palabras,  Te  es  la  periodo  de  la  señal 
en  el  momento  de  emisión  y Td  el  periodo  en  el  momento  de  detección.)  La  distancia  recorrido 
por  la  segunda  señal  es  por  lo  tanto 


Ai  + Td  — Te  — h + — a(Aí  + Td)2  — — aT2 

« h + -a(Aí)2  + aTdAt,  (8.16) 

donde  en  la  última  igualdad  hemos  supuesto  que  Td  y Te  son  pequeñas  en  comparación  con  Ai. 
Podemos  obtener  fácilmente  la  relación  entre  Te  y Td  restando  (8.14)  de  (8.16), 


Td  - Te  « aTdAt,  (8.17) 

o sustituyendo  la  expresión  (8.15)  para  A t 

Te«  (l-ah)Td,  (8.18) 


de  modo  que  el  periodo  de  la  señal  es  mayor  en  el  momento  de  detección  que  en  el  momento  de 
emisión.  En  otras  palabras  la  señal  ha  sufrido  un  corrimiento  hacia  el  rojo  con  un  factor  (1  — ah). 
Dado  que  para  el  observador  O',  que  se  cree  en  un  campo  gravitatorio,  el  factor  ah  es  la  diferencia 
del  potencial  gravitatorio  entre  el  emisor  y el  detector,  el  Principio  de  Equivalencia  predice 
que  en  un  campo  gravitatorio  constante  la  luz  sufre  un  efecto  Doppler  gravitacional 


Te 


Td. 


(8.19) 


En  la  sección  10.4  deduciremos  una  expresión  más  exacta  para  el  efecto  Doppler  gravitacional  en 
un  campo  inhomogéneo. 

Por  último,  el  efecto  Doppler  gravitacional  tiene  una  consecuencia  directa:  la  dilatación  gravi- 
tacional del  tiempo.  El  observador  O'  podría  considerar  al  emisor  como  un  reloj  que  emite  pulsos 
con  una  cierta  frecuencia  y comparar  esta  frecuencia  con  la  de  un  reloj  similar  situado  donde  el 
detector.  Debido  al  efecto  Doppler  gravitacional,  notará  que  el  reloj  en  el  suelo  del  ascensor  corre 
menos  rápido  que  el  reloj  en  el  techo.  Esto  se  corresponde  con  el  hecho  de  que  un  reloj  abajo 
en  un  campo  gravitatorio  va  más  lento  que  uno  más  arriba,  donde  la  diferencia  viene  dada  por 
(8.19). 

9 Obviamente,  la  ecuación  (8.14)  tiene  otra  solución,  pero  ésta  es  negativa,  de  modo  que  se  puede  rechazar  por  razones 
físicas. 
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Figura  8.6:  Dos  observadores  O y O'  respectivamente  fuera  y dentro  de  un  disco  que  gira  alrededor  de  su 
centro  con  una  velocidad  angular  os  con  respecto  al  observador  O.  Tanto  O como  O1  coinciderán  en  que  los 
relojes  en  el  disco  van  más  lento  cuanto  más  lejos  están  del  centro  y que  O1  medirá  que  la  circunferencia 
de  círculos  es  mayor  que  2tt r,  pero  no  se  pondrán  de  acuerdo  sobre  la  razón  de  estos  fenómenos.  Para  O 
es  debido  a la  rotación  del  disco,  mientras  que  para  O1  es  debido  a la  presencia  de  un  campo  gravitatorio 
radial. 


8.5.  Experimentos  en  un  disco  rotante 

Consideramos  ahora  un  disco  grande  girando  alrededor  de  su  centro  con  una  velocidad  an- 
gular os,  con  respecto  a un  observador  externo  O,  de  modo  que  la  velocidad  (lineal)  v de  un  punto 
del  disco  a radio  r del  centro  viene  dada  por  v = ros.  En  el  disco,  moviéndose  con  él,  hay  un  se- 
gundo observador  O'  (véase  Figura  8.6).  Para  O (y  para  la  mecánica  newtoniana  y la  relatividad 
especial)  el  observador  O'  no  es  un  observador  inercial  y las  leyes  de  la  físcia  no  tienen  validez 
en  su  sistema  de  referencia.  Según  la  relatividad  general  y el  Principio  de  Equivalencia,  las  leyes 
de  la  físcia  tienen  la  misma  validez  en  todos  los  sistemas  de  referencia.  El  observador  O'  es  por 
lo  tanto  un  observador  igualmente  válido  (aunque  posiblemente  más  complicado)  que  O para 
describir  los  efectos  físicos  observados. 

Imaginémosnos  ahora  la  discusión  entre  el  observador  externo  O,  que  sabe  relatividad  espe- 
cial, pero  no  relatividad  general,  y el  observador  en  rotación  O'  que  sabe  geometría  diferencial 
(aunque  no  necesariamente  relatividad  general).  O intentará  convencer  a O'  de  que  su  sistema 
de  referencia  no  es  un  sistema  inercial  y que  su  propio  sistema  es  más  adecuado  para  describir 
los  fenómenos  físicos. 

El  primer  argumento  de  O es  el  mismo  que  en  el  caso  del  ascensor:  O1  es  claramente  un 
observador  acelerado,  puesto  que  nota  pseudo-fuerzas:  la  fuerza  centrifuga  (la  inercia  de  objetos 
que  les  hace  seguir  líneas  rectas  con  respecto  a O)  hace  que  en  el  sistema  de  O'  las  partículas 
libres  estén  sometidas  a aceleraciones  y "caigan"  hacia  el  borde  del  disco.  O'  sin  embargo  replica 
que  la  fuerza  que  él  nota  es  una  fuerza  ejercido  por  un  campo  gravitatorio  radial  y que  por  lo 
tanto  no  hay  partículas  libres.  Las  aceleraciones  observadas  satisfacen  perfectamente  la  segunda 
ley  de  Newton  en  presencia  de  gravedad  (por  lo  menos  localmente). 

Efectivamente,  una  partícula  sigue  una  trayectoria  r(t)  = ro  eos  ost  ex  + ro  sin  ost  ey  en  las 
coordenadas  de  O mientras  que  está  sujetado  por  O',  y una  trayectoria  r(t)  = ro  ex  + roost  ey  si 
O1  la  suelta  en  el  momento  t = 0.  Sin  embargo,  podemos  adaptar  las  coordenadas  de  O'  a través 
del  cambio  de  coordenadas 


x'  = eos  ust  x + sinwt  y, 

y'  = — sin  ust  x + eos  ust  y.  (8.20) 

Obsérvese  que  este  cambio  de  coordenadas  es  simplemente  una  rotación  en  R2  que  depende  del 
tiempo.  En  particular  hemos  despreciado  efectos  relativistas  como  la  contracción  de  Lorentz  y la 
dilatación  del  tiempo.  El  cambio  de  coordenadas  por  lo  tanto  es  solamente  válido  cerca  del  centro 
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del  disco,  en  el  rango  de  coordenadas  donde  u>r  ~ u¡t  <C  1. 

Por  lo  tanto  en  las  coordenadas  de  O',  la  trayectoria  de  la  partícula  satisface  la  ecuación 


r(t)  = roe*' 


(8.21) 


para  t < 0 y 


r{t) 


rocosut  + rout  sin  ut 


— rosinwí  + r Qhjt  eos  u>t 


eyi 


(8.22) 


para  t > 0.  Dentro  el  rango  de  validez  del  cambio  de  coordenadas  (8.20)  podemos  desarollar  los 
senos  y cosenos  en  una  desarrollo  de  Taylor,  hasta  orden  (ojt)2 , de  modo  que  en  esta  aproximación 
la  trayectoria  de  la  partícula  viene  dada  por 


f(t) 


ro  + ^r0oj2t2 


(8.23) 


En  otras  palabras,  para  O'  la  partícula  se  comporta  como  si  estuviera  en  reposo  para  t < 0 y 
en  caída  libre,  con  aceleración  gravitacional  g = -tqu>2  para  i > 0,  por  lo  menos  en  primera 
aproximación.  Las  correcciones  de  órdenes  más  altas  dan  lugar  a efectos  de  marea. 

Además  O observará  que,  debido  a la  dilatación  del  tiempo,  relojes  colocados  en  el  disco  a 
distintas  distancias  del  centro  van  a ritmos  diferentes.  El  reloj  colocado  exactamente  en  el  centro 
va  a la  misma  velocidad  que  el  reloj  externo  de  O,  pero  cuanto  más  hacia  el  borde  del  disco,  más 
dilatación  sufre.  En  particular,  un  reloj  colocado  a una  distancia  r del  centro  sufre  en  un  intervalo 
infinitesimal  dt  medido  por  O una  dilatación  temporal 

dt\r)  = d\  (8.24) 

yl  — r¿Lü¿ 


(Nótese  que  tenemos  que  utilizar  intervalos  infinitesimales,  puesto  que  los  dos  observadores  O 
y O'  no  son  mutuamente  inerciales  y por  lo  tanto  no  se  puede  aplicar  ingenuamente  la  formula 
(3.3).  Sólo  en  intervalos  infinitesimales  la  aproximación  es  más  o menos  fiable.)  El  observador  O' 
en  el  disco  notará  también  que  relojes  mas  alejados  del  centro  van  más  lentos.  Sin  embargo  todos 
los  relojes  en  el  disco  están  en  reposo  con  respecto  a O' , independientemente  de  la  posición  de 
O'  y por  lo  tanto  O'  no  puede  asignar  los  ritmos  diferentes  al  movimiento  relativo  con  respecto  a 
él.  Por  lo  tanto  O'  atribuirá  la  diferencia  de  los  ritmos  de  los  relojes  a la  diferencia  en  el  potencial 
gravitatorio  entre  el  centro  del  disco  y la  posición  de  los  relojes,  es  decir,  al  efecto  de  dilatación 
gravitacional  del  tiempo.  Efectivamente,  para  ur  <C  1,  podemos  expandir  (8.24)  en  una  serie  de 
Taylor  y obtener 


dt' {r)  « dt 


1 + -wV 


= dt 


1 — -Qr 
2y 


(8.25) 


Comparando  esta  expresión  con  (8.19),  vemos  que  en  primera  aproximación  las  dos  expresiones 
tienen  la  misma  forma,  aunque  ésta  última  tiene  un  extra  factor  1/2.  En  otras  palabras,  en  la 
aproximación  utilizada,  la  correspondencia  entre  las  dos  fórmulas  no  es  exacta,  debido  al  hecho 
de  que  O y O'  no  están  relacionados  a través  de  una  transformación  de  Lorentz  tipo  (3.3),  ya 
que  no  son  inerciales.  Aún  así,  la  correspondencia  es  suficientemente  buena  (orden  de  magnitud) 
para  sugerir  un  efecto  de  dilatación  temporal  gravitacional.  Para  una  correspondencia  mayor, 
habrá  que  recurrir  a un  análisis  que  tome  en  cuenta  los  efectos  relativistas  y el  cambio  general  de 
coordenadas. 


Por  último,  O insistirá  en  que  puede  demostrar  que  O'  se  está  moviendo  debido  a la  contrac- 
ción de  Lorentz.  Cuando  O mide  la  proporción  entre  el  radio  y la  circunferencia  de  un  círculo  con 
centro  en  el  centro  del  disco,  medirá  que  la  proporción  es  exactamente  27t.  Por  otro  lado.  O'  me- 
dirá el  mismo  radio  que  O,  pero  una  circunferencia  más  larga,  debido  a que  la  regla  de  O'  sufre 
una  contracción  de  Lorentz  al  medir  la  circunferencia,  pero  no  al  medir  el  radio,  ya  que  la  contrac- 
ción de  Lorentz  sólo  es  longitudinal.  O'  llegaría  por  lo  tanto  a la  conclusión  que  O > 27t r' . Este 
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resultado  anómalo  para  la  geometría  euclídea  es  para  O la  prueba  de  que  O'  se  mueve,  mientras 
para  O'  es  simplemente  un  artefacto  de  la  presencia  del  campo  gravitatorio,  que  deforma  sus  re- 
glas de  medir.  Para  él,  la  presencia  de  un  campo  gravitatorio,  la  dilatación  temporal  gravitatorio 
y la  geometría  no-euclidea  están  intimamente  ligadas.  (También  aquí  habrá  que  tener  la  suficien- 
te cautela  y darse  cuenta  de  que  estrictamente  hablando  la  fórmula  (3.5)  no  es  válida  entre  dos 
observadores  mutuamente  no-inerciales). 

Es  interesante  observar  que  el  campo  gravitatorio  visto  por  O'  tiene,  a escalas  globales,  unas 
propiedades  distintas  de  las  de  un  campo  gravitatorio  causado  por  un  objeto  masivo,  como  la 
Tierra.  Localmente  no  se  puede  apreciar  diferencias  (debido  al  Principio  de  Equivalencia),  pero 
cuando  una  empieza  a tomar  en  cuenta  los  efectos  de  marea,  se  da  cuenta  de  que  la  estructura 
es  distinta  a la  de  un  campo  gravitacional  usual.  Si  el  observador  O'  suelta  simultáneamente  dos 
bolas,  O verá  que  las  bolas  se  mueven  radialmente  hacia  fuera.  En  otras  palabras,  en  las  coorde- 
nadas de  O'  las  bolas  se  alejan  ligeramente  al  caer,  en  contraste  con  lo  que  vería  un  observador 
situado  en  la  superficie  de  la  Tierra  (véase  figura  8.4).  La  gran  diferencia  entre  este  campo  gravi- 
tacional y el  de  la  Tierra  es  que  aquí  las  líneas  de  fuerza  emanan  de  un  solo  punto  en  lugar  de 
desaparecer  en  él.  Este  campo  gravitatorio  parece  tener  un  carácter  repulsivo  desde  el  centro,  más 
que  atractivo.  Otra  manifestación  de  este  fenómeno  es  que  la  proporción  entre  circunferencias  y 
radios  de  círculos  es  mayor  que  27 r,  una  propiedad  de  geometrías  con  curvatura  negativa,  mien- 
tras que  en  espacios  con  curvatura  positiva,  como  una  esfera,  la  proporción  entre  circunferencia 
y radio  siempre  es  menor  que  27 r. 

Unos  comentarios  sobre  la  geometría  del  disco  * 

Aunque  Einstein  siempre  ha  dicho  que  el  ejemplo  del  disco  rotante  le  ha  hecho  darse  cuenta 
de  la  necesidad  de  incorporar  la  geometría  no-euclidea  en  la  descripción  de  la  gravedad,  el  ejem- 
plo también  puede  llegar  a confundir  mucho,  si  no  se  trata  con  cuidado.  La  confusión  surge  si 
nos  damos  cuenta  que  en  realidad  aquí  no  estamos  tratando  con  un  espacio  con  una  geometría 
no-euclidea,  sino  con  el  espacio  plano.  Esto  es  obvio  desde  el  punto  de  vista  de  O,  que  es  un  ob- 
servador inercial  (newtoniano)  en  el  espacio  de  Minkowski.  Pero  si  la  única  diferencia  entre  O y 
O'  es  un  cambio  de  coordenadas,  aunque  uno  general,  está  claro  que  las  propiedades  geométricas 
del  espacio  visto  por  O'  tienen  que  ser  las  mismas  que  las  visto  por  O.  En  particular,  si  el  tensor 
de  Riemann  es  idénticamente  cero  para  O,  también  lo  es  para  O' . 

Pero  entonces  surge  directamente  la  pregunta  ¿a  qué  son  debido  los  efectos  descritos  arriba? 
En  otras  palabras,  ¿cuál  es  la  causa  de  los  efectos  gravitatorios,  si  no  es  la  curvatura?  En  realidad 
ya  hemos  visto  la  respuesta  en  la  sección  8.2:  comparando  las  formulas  (8.12)  y (8.13)  vimos  que 
lo  que  para  Newton  era  la  fuerza  gravitatoria,  era  para  Einstein  un  término  geométrico  que  con- 
tiene los  símbolos  de  Christoffel.  Por  lo  tanto,  la  fuerza  gravitatoria,  como  la  sensación  de  tener 
peso,  no  es  tanto  una  manifestación  de  la  curvatura  de  espacio,  sino  del  hecho  de  no  utilizar  (o  no 
poder  utilizar)  coordenadas  cartesianas.  En  estas  coordenadas  curvilineas  los  símbolos  de  Chris- 
toffel son  distintos  de  cero  y su  presencia  en  la  ecuación  de  movimiento  puede  ser  interpretada 
como  una  pseudo-fuerza,  la  gravedad.  Y como  hemos  visto,  los  símbolos  de  Christoffel  no  sólo 
son  distintos  de  cero  en  los  espacios  curvos,  sino  también  en  el  espacio  plano  en  coordenadas 
curvilineas. 

Concretamente,  para  el  caso  del  disco  rotante,  la  explicación  es  bastante  sutil.  Por  un  lado 
vemos  que  el  cambio  de  coordenadas  (8.20)  y su  generalización  relativista  entre  las  coordena- 
das cartesianas  de  O y las  coordenadas  corrotantes  de  O'  inducen  unos  símbolos  de  Christoffel 
no-ceros  en  las  coordenadas  de  O' , lo  que  le  da  una  sensación  de  gravedad  dirigida  radialmente 
hacia  fuera  (es  decir,  le  da  una  sensación  de  arriba  y abajo).  Pero  si  O'  decidiera  utilizar  coordena- 
das localmente  inerciales,  observaría  que  la  fuerza  gravitatoria  no  sólo  desaparece  en  un  pequeña 
región  alrededor  de  él,  sino  en  el  espacio  entero,  debido  a que  en  realidad  está  en  el  espacio  de 
Minkowski. 

Por  otro  lado,  ¿cómo  explicamos  entonces  que  O'  mide  propiedades  geométricas  en  el  disco. 
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correspondientes  con  una  curvatura  negativa?  El  análisis  general  es  complicado,10  pero  el  punto 
clave  es  que  las  propiedades  geométricas  que  mide  O'  no  son  las  del  espaciotiempo  de  Minkows- 
ki,  sino  las  de  la  geometría  espacial  (tridimensional)  asociada  con  el  disco.  Estrictamente  hablan- 
do resulta  que  no  es  posible  definir  una  geometría  espacial  del  disco  rotante  (por  varias  razones, 
una  de  ellas  la  imposibilidad  de  definir  una  superficie  t = constante  para  distintos  observadores 
moviéndose  en  el  disco).  Pero  uno  podría  reducir  la  linea  de  universo  de  cada  observador  en  el 
disco  a un  solo  punto  y considerar  la  geometría  de  la  variedad  obtenida  a través  de  esta  pro- 
yección. Resulta  que  la  geometría  tridimensional  espacial  que  surge  de  este  modo  (¡que,  ojo,  no 
se  puede  interpretar  como  la  geometría  espacial  del  disco,  ni  como  la  del  espaciotiempo!)  tiene 
curvatura  negativa  si  consideramos  distancias  pequeñas.  Sin  embargo,  a escalas  más  grandes,  la 
noción  de  distancias  entre  puntos  depende  del  método  utilizado  para  medirlo  y en  general  ni  si- 
quiera es  simétrica  (es  decir,  ¡la  distancia  entre  p y q en  el  disco  no  suele  coincidir  con  la  distancia 
entre  q y p\),  de  modo  que  a distancias  más  grandes,  la  variedad  pierde  sus  propiedades  de  una 
variedad  riemanniana. 


8.6.  La  relatividad  general  y los  sistemas  inerciales 

En  las  dos  secciones  anteriores  hemos  podido  seguir  las  discusiones  entre  dos  pares  de  obser- 
vadores que  no  se  ponían  de  acuerdo  sobre  cuál  de  ellos  estaba  en  reposo  y cuál  estaba  acelerado. 

Para  la  mecánica  newtoniana  e incluso  la  relatividad  especial,  el  asunto  es  muy  sencillo:  aun- 
que las  posiciones  y las  velocidades  son  relativas,  las  aceleraciones  son  absolutas,  en  el  sentido 
de  que  las  nota  cualquier  observador.  Por  lo  tanto  un  observador  puede  saber  perfectamente  si 
está  en  un  sistema  inercial  o no:  si  se  nota  que  las  partículas  en  su  sistema  de  referencia  sufren 
aceleraciones  no-inerciales,  es  decir,  aceleraciones  que  no  se  atribuyen  a fuerzas  que  actúan  so- 
bre las  partículas,  entonces  el  sistema  no  es  inercial.  Por  otra  lado,  si  todas  las  aceleraciones  se 
pueden  adscribir  a fuerzas  (es  decir,  si  es  válida  la  segunda  ley  de  Newton),  el  sistema  es  inercial. 

El  Principio  de  Equivalencia  complica  seriamente  esta  idea  ingenua.  Hemos  visto  que  los  ob- 
servadores en  caída  libre  no  notan  ninguna  fuerza  gravitatoria  y los  observadores  en  un  ascensor 
acelerado  pueden  llegar  a pensar  que  están  en  resposo  en  un  campo  gravitacional.  El  Principio 
de  Equivalencia  implica  que  no  solamente  las  velocidades,  sino  también  las  aceleraciones  son 
relativas. 

Pero  si  no  podemos  distinguir  entre  aceleraciones  inerciales  y no-inerciales,  incluso  si  no  po- 
demos afirmar  si  un  observador  está  acelerado  o no,  ¿cómo  podemos  identificar  los  sistemas 
inerciales?  Es  una  pregunta  importante,  ya  que  uno  de  los  postulados  de  la  relatividad  especial 
es  que  las  leyes  de  la  física  son  válidas  para  observadores  inerciales.  Si  no  sabemos  quiénes  son 
estos  observadores  inerciales,  ¿cómo  sabemos  para  quién  la  relatividad  especial  es  correcta?  En 
otras  palabras,  la  pregunta  se  reduce  a ¿cómo  encaja  la  relatividad  especial  dentro  del  marco  de 
la  relatividad  general? 

En  el  libro  "The  Evolution  oí Physics"  (1938),  Albert  Einstein  y Leopold  Infeld  (1898  - 1968)  se 
hacían  la  pregunta  de  cómo  definir  un  sistema  inercial  y,  más  profundo  aún,  si  es  que  realmente 
existen  los  sistemas  inerciales.  Su  conclusión  era  que  el  concepto  clásico  de  sistema  inercial  no 
está  bien  definido,  ya  que  para  identificarlo  hace  falta  recurrir  a un  razonamiento  circular:  según 
Newton,  un  sistema  inercial  es  aquel  sistema  donde  una  partícula  libre  de  influencias  externas 
viaja  de  manera  uniforme  y rectilínea.  Pero  la  única  manera  de  definir  "una  partícula  libre  de 
influencias  externas"  es  justamente  como  una  partícula  que  viaja  de  manera  uniforme  y rectilínea 
en  un  sistema  inercial.  Einstein  e Infeld  por  lo  tanto  hacen  el  comentario  irónico 

10Para  una  buena  discusión  del  tema,  referimos  a la  entrada  de  "Born  coordinates"  en  Wikipedia  y a las  referencias 
allí  dadas. 
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"Hemos  aprendido  mucho  sobre  las  leyes  de  la  física:  que  son  invariantes  bajo  las  transformaciones 
de  Lorentz  y que  son  válidas  en  todos  los  sistemas  inerciales  que  se  mueven  de  manera  uniforme 
entre  ellos.  Es  cierto  que  tenemos  las  leyes,  pero  no  sabemos  a qué  sistema  de  referencia  se  refieren 
[...]  y así  parece  que  toda  la  construcción  mental  física  está  construida  sobre  arena." 

La  solución  de  este  problema  está  en  relajar  el  estatus  especial  que  da  la  mecánica  newto- 
niana  y la  relatividad  especial  a los  sistemas  inerciales.  El  Principio  de  Covariancia  dice  que  el 
lenguaje  tensorial  permite  escribir  las  leyes  de  la  física  de  manera  que  son  válidas  para  todos  los 
observadores  y el  Principio  de  Equivalencia  nos  enseña  que  cualquier  observador  tiene  derecho  a 
considerarse  inercial,  ya  que  siempre  puede  interpretar  posibles  aceleraciones  no-inerciales  como 
efectos  gravitatorios. 

Por  lo  tanto,  también  el  concepto  de  sistema  inercial  se  ha  vuelto  relativo  y surge  una  nueva 
imagen:  en  lugar  de  que  exista  una  única  clase  de  sistemas  que  es  umversalmente  reconocida 
como  inercial,  existen  varias  clases  de  observadores  que  se  llamarán  inerciales  a sí  mismos  y a 
los  miembros  de  su  clase  y no-inerciales  a los  que  no  están  en  su  clase.  Dos  observadores  que 
no  pertenecen  a la  misma  clase  estarán  de  acuerdo  en  que  no  están  en  la  misma  clase,  es  decir, 
en  que  hay  aceleraciones  relativas  entre  los  dos,  pero  no  estarán  de  acuerdo  sobre  quién  es  el 
inercial  y quién  está  acelerado.  Por  ejemplo,  los  dos  observadores  en  caída  libre,  uno  por  encima 
del  polo  norte  y otro  por  encima  del  ecuador,  se  verán  mutuamente  acelerados,  pero  cada  uno  se 
consideraría  a si  mismo  inercial. 

¿Dónde  entra  entonces  la  relatividad  especial?  Un  observador,  que  se  considera  a sí  mismo 
inercial  y que  utiliza  coordenadas  localmente  inerciales,  verá  el  espaciotiempo  localmente  como 
Minkowski  (en  primera  aproximación)  y dirá  que  el  grupo  de  simetría  es  el  grupo  de  Lorentz. 
Concretamente  está  relacionado  a través  de  una  transformación  de  Lorentz  con  cualquier  otro 
observador  cercano  de  la  misma  clase  y entre  los  dos  observadores  habrá  los  conocidos  efectos 
relativistas  de  la  sección  3.1,  como  la  dilatación  del  tiempo  y la  contracción  de  Lorentz. 

Pero  estos  efectos  sólo  serán  una  primera  aproximación  a nivel  local,  ya  que  el  espaciotiempo 
en  coordenadas  localmente  inerciales  sólo  se  aproxima  a Minkowski  en  una  región  pequeña.  En 
general  el  espaciotiempo  global  no  tendrá  la  simetría  del  grupo  de  Lorentz,  por  la  curvatura 
de  la  variedad,  y dos  observadores  en  distintas  regiones  del  espaciotiempo  no  están  en  general 
relacionados  a través  de  una  transformación  de  Lorentz  y se  verán  mutuamente  como  acelerados, 
debido  a las  inhomogeneidades  del  campo  gravitatorio.  En  principio  incluso  no  tiene  sentido 
hablar  de  la  velocidad  relativa  entre  estos  dos  observadores,  ya  que  el  sistema  de  coordenadas 
localmente  inerciales  (y  por  lo  tanto  el  espacio  de  Minkowski)  de  cada  observador  es  muy  distinto 
al  del  otro.  Matemáticamente  los  vectores  de  velocidad  de  cada  observador  pertenecen  a espacios 
tangentes  distintos  y no  hay  manera  natural  de  compararlos. 

En  resumen,  la  relatividad  especial  está  incorporada  en  la  relatividad  general  como  una  apro- 
ximación a escalas  pequeñas,  donde  es  válido  el  Principio  de  Equivalencia.  Este  Principio  nos 
dice  que  cualquier  observador  se  puede  considerar  localmente  como  inercial  y verá  localmente 
que  la  relatividad  especial  es  válida. 


133 


Capítulo  9 


Las  ecuaciones  de  Einstein 


El  espacio  dice  cómo  se  mueve  ia  materia. 

La  materia  dice  cómo  se  curva  ei  espacio. 

(J.A.  Wheeler) 

En  los  Capítulos  6 y 7 hemos  visto  la  geometría  diferencial  como  la  herramienta  matemáti- 
ca necesaria  para  tratar  con  espacios  curvos  y en  el  Capítulo  9 hemos  encontrado  argumentos 
heurísticas  para  creer  que  los  espacios  curvos  son  una  buena  descripción  de  la  fuerza  gravitato- 
ria.  En  este  capítulo  formalizaremos  esta  idea,  dando  la  formulación  exacta  de  las  interacciones 
gravitatorias  en  términos  de  espacios  curvos.  A partir  de  ahora  asumiremos  siempre  que  la  co- 
nexión utilizada  es  la  de  Levi-Civita. 


9.1.  El  tensor  de  energía-momento 

En  el  capítulo  anterior  hemos  visto  como  el  Principio  de  Equivalencia  nos  da  una  manera 
heurística  para  describir  el  campo  gravitatorio,  como  la  curvatura  del  espacio.  Pero  no  hemos 
dicho  todavía  qué  es  lo  que  curva  el  espacio.  De  la  gravedad  newtoniana  sabemos  que  la  fuente 
de  la  fuerza  gravitatoria  es  la  masa  de  los  objetos  en  el  espacio,  así  que  cabe  esperar  que  sea  la 
materia  la  que  curva  el  espacio.  Esto  es  verdad,  aunque  no  es  la  única  fuente  de  curvatura. 

La  relatividad  especial  nos  enseña  que  la  masa  de  un  objeto  es  sólo  una  de  las  posibles  ma- 
nifestaciones de  energía  y que  es  posible  convertir  una  cosa  en  la  otra,  a través  de  la  relación 
E = me 2 . Por  ejemplo,  la  masa  de  un  núcleo  de  helio  es  menor  que  la  suma  de  las  masas  de 
sus  componentes  (2  protones  y 2 neutrones),  siendo  la  diferencia  la  energía  que  se  libera  en  un 
proceso  de  fusión  nuclear  (y  neutrinos).  Para  que  el  Principio  de  Equivalencia  siga  siendo  válido 
y la  masa  gravitacional  del  núcleo  de  helio  sea  igual  a la  masa  inercial,  la  gravedad  se  tiene  que 
acoplar  no  sólo  a las  masas  de  los  componentes,  sino  también  a la  energía  (negativa)  de  ligadura. 
En  general,  la  gravedad  se  acopla  a cualquier  tipo  de  energía  y momento  en  el  espaciotiempo, 
incluido  la  energía  de  cualquier  tipo  de  campos  presentes  o de  la  propia  curvatura  del  espacio. 

La  pregunta  ahora  surge  cómo  describir  la  energía,  la  masa  y el  momento  de  la  materia  de 
una  manera  útil  y manejable.  En  el  Capítulo  5 ya  hemos  dado  una  descripción  para  el  vector  de 
energía-momento  p1'  y la  masa  mo  de  una  partícula,  pero  esta  descripción  no  es  muy  práctica  si 
tratamos  con  grandes  cantidades  de  partículas  o con  campos.  En  estos  casos  es  más  conveniente 
describir  el  sistema  como  un  fluido,  un  sistema  continuo  caracterizado  por  funciones  continuas 
en  el  espaciotiempo.  La  gran  diferencia  es  que  estas  funciones  son  cantidades  macroscópicas,  co- 
mo la  velocidad  del  fluido,  la  densidad,  la  presión,  etc,  más  que  la  energía  y el  momento  de  cada 
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una  de  las  partículas  individuales.  El  objeto  que  describe  la  energía  y el  momento  de  este  fluido 
es  el  tensor  de  energía-momento  rfll,y.  En  esta  sección  nos  limitaremos  por  razones  pedagógicos  al 
caso  del  espacio  plano  = r¡llv.  En  la  sección  9.3  contaremos  cómo  generalizarlo  a espacios 
arbitarios. 

Hay  dos  maneras  de  definir  el  tensor  de  energía-momento:  una  manera  es  a través  de  un 
principio  variacional  de  la  acción  que  describe  el  sistema  considerado  y esta  manera  trataremos 
en  la  sección  9.3.  La  otra  manera  es  más  directa  y más  física.  La  definición  entonces  del  tensor  de 
energía-momento  7’,í"  es  el  flujo  de  cuadrimomento  p1'  a través  de  una  superficie  xv  constante. 
Esta  definición  puede  sonar  muy  poco  iluminativa,  pero  en  realidad  no  es  más  que  la  generaliza- 
ción de  un  vector  de  corriente,  como  por  ejemplo  j11'. 

En  electromagnetismo  la  densidad  de  corriente  j/l  = puP  es  el  flujo  de  de  carga  eléctrica  q, 
una  cantidad  escalar,  a través  de  una  superficie  constante.  En  particular,  la  componente  j°, 
la  densidad  de  carga  p,  se  puede  ver  como  el  flujo  de  carga  a través  de  una  superficie  espacial 
t = t o-  De  la  misma  manera,  las  componentes  espaciales  jl  representan  el  flujo  de  carga  a través 
de  una  superficie  temporal  xl  = xl0.  Además  la  ley  de  conservación  de  carga  d^j^  = 0 dice  que 
el  cambio  de  densidad  de  carga  en  un  volumen  es  igual  al  flujo  de  carga  a través  la  superficie  del 
volumen. 

En  el  caso  del  tensor  de  energía-momento,  la  idea  es  la  misma,  sólo  que  en  lugar  de  ser  el  flujo 
de  una  cantidad  escalar,  es  el  flujo  de  una  cantidad  vectorial,  el  cuadrimomento  p1' . El  objeto  que 
describe  este  flujo  por  lo  tanto  no  es  un  vector,  sino  un  tensor  simétrico  TMl/  de  rango  2. 

De  este  modo,  las  componentes  7’,'°  = T0/í  son  el  flujo  de  p1'  a través  de  una  superficie  espacial 
x°  = cte.  En  particular,  T00  es  la  densidad  de  energía,  el  flujo  de  energía  en  la  dirección  temporal, 
mientras  T°‘  es  la  densidad  de  momento,  el  flujo  de  momento  a través  de  una  superficie  x°  = cte. 
Los  componentes  Ty  tienen  que  ver  con  las  fuerzas  que  ejercen  elementos  infinitesimales  del  flui- 
do sobre  otros  elementos  cercanos.  Por  ejemplo  los  elementos  diagonales  (sin  sumatorio, 

por  esto  ponemos  los  índices  entre  paréntesis)  representan  la  componente  Fl  de  la  fuerza  sobre 
la  superficie  xl  = cte , o sea  la  presión  P1  en  la  dirección  xl. 

Aclaramos  estos  conceptos  generales  un  poco  más  con  unos  ejemplos  concretos.  El  tensor  de 
energía-momento  de  un  conjunto  de  partículas  que  no  interaccionan,  también  llamado  materia 
fría  o materia  no-relativista,  viene  dado  por 


rj-ifllS 

(mat) 


Po  vPvP 


(9.1) 


donde  po  es  la  densidad  de  las  partículas  en  el  sistema  de  referencia  en  reposo  con  respecto 
a las  partículas  y vJ‘  es  la  cuadrivelocidad,  definida  en  (5.27).  En  el  sistema  de  referencia  de 
un  observador  comóvil,  que  se  mueve  junto  con  el  fluido,  es  decir,  que  tiene  el  mismo  vector  de 
velocidad  u7‘  que  el  fluido  alrededor  de  él,  la  única  componente  non-nula  es  7)¡aat . = p0,  es  decir 
la  densidad  de  materia.  En  otras  palabras,  la  materia  no-interactiva  no  tiene  presión.  La  ley  de 
conservación  de  energía  (masa)  dice  que  en  estas  coordenadas  dtpo  = 0,  ó en  componentes  del 
tensor  de  energía-momento,  0()7'ffít)  = 0.  En  cualquier  otro  sistema  de  referencia,  relacionado  a 
través  de  una  transformación  de  Lorentz  con  el  sistema  en  reposo,  esta  expresión  toma  la  forma 


durr = 0. 

h (mat) 


(9.2) 


No  es  difícil  de  ver  que  la  componente  0 de  esta  expresión  corresponde  con  la  ley  de  conservación 
de  energía  en  forma  de  una  ecuación  de  continuidad 

do  T(°°at)  + a¿7^at)  = dtp  + di  (, ov ¿)  = 0,  (9.3) 


donde  p = 7 2 y o es  la  densidad  medida  por  el  observador  en  movimiento  uniforme  con  respecto 
a las  partículas  y pvl  es  la  densidad  de  momento.  La  densidad  de  masa  en  una  región  aumenta  o 
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disminuye  por  lo  tanto  por  el  flujo  de  materia  (momento)  que  entra  o sale.  Las  componentes  i de 
la  ecuación  (9.2)  son  la  ley  de  conservación  de  momento,  ya  que  se  traduce  a 

doT^Lt)  + (9.4) 

lo  que  corresponde  a la  versión  de  la  ecuación  de  Euler  en  la  mecánica  de  fluidos,  para  el  caso  de 
un  fluido  sin  presión  ni  fuerzas  externas. 

Las  leyes  de  conservación  de  energía  y momento,  codificadas  en  esta  expresión  son  tan  funda- 
mentales que  se  puede  tomar  esta  última  expresión  como  una  condición  necesaria  para  un  tensor 
de  energía-momento  físciamente  relevante.  Veremos  en  la  sección  9.2  que  la  condición  V,,  '/7"'  = 0 
juega  un  papel  importante  en  la  formulación  de  las  ecuaciones  del  campo  gravitacional. 

Un  ejemplo  un  poco  más  complicado  es  el  caso  del  fluido  perfecto,  con  densidad  p y presión 
P.  El  tensor  de  energía-momento  en  este  caso  viene  dado  por 

Tfperf.fl.)  = (Po  + P)uV  - PrT-  (9.5) 

Un  observador  comóvil,  verá  localmente  un  fluido  isótropo  y para  este  observador,  el  tensor  de 
energía-momento  tiene  la  forma  sencilla 


Po  0 0 0 \ 

0 P 0 0 

0 0 P o 

0 0 0 P / 


(9.6) 


Se  puede  demostrar  que,  imponiendo  H . = 0 en  (9.5)  para  el  caso  de  espacio  plano, 

encontramos  las  leyes  de  conservación  de  energía  y de  momento  en  la  versión  relativista: 

dnipou11)  -t-Pd^iP  = 0, 

(po  + P)u^dlxuv  - dvP  + d^Pu^u"  = 0.  (9.7) 


En  general  la  presión  y la  densidad  del  fluido  no  son  variables  independientes  y la  relación 
entre  las  dos  se  llama  la  ecuación  de  estado,  P = P(p).  Muchas  veces  se  supone  una  relación  lineal 
entre  la  presión  y la  densidad 

P = wp,  (9.8) 

donde  la  constante  de  proporcionalidad  w es  el  parámetro  de  la  ecuación  de  estado  . El  tensor 
de  energía-momento  (9.5)  y la  ecuación  de  estado  (9.8)  son  de  gran  importancia  en  la  cosmo- 
logía, donde  los  distintos  tipos  de  energía  están  representados  por  fluidos  perfectos  con  distintos 
valores  de  w.  Por  ejemplo,  la  materia  se  comporta  como  materia  fría  y está  caracterizado  por 
P = 0,  mientras  la  radiación  (o  materia  relativista)  satisface  P = |p  y una  constante  cosmológica 
P = —p.  Entraremos  en  más  detalle  en  el  Capítulo  12. 

Finalmente,  un  tensor  de  energía-momento  del  campo  electromagnético  viene  dado  por 


T(em)  = ~F^F%  + -rTFpxF*. 


Efectivamente,  en  lenguaje  tridimensional  en  función  de  los  campos  eléctricos  E y magnéticos  B, 
los  componentes  se  traducen  a (ejerc.) 


C)  = \(e2+B2)i  T(L)  = (E  x B)i, 

T(L)  = EiEi  + BiBj  + ^(E2  + B2).  (9.10) 
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EnT°°m)  reconocemos  la  expresión  para  la  densidsad  de  energía  Eem  del  campo  electromagnético 
(1.39a),  mientras  T^*m^  son  las  componentes  del  vector  de  Poynting  (1.39b),  S = Ex  B,  que  descri- 
be el  flujo  de  energía  y del  momento  del  campo  electromagnético.  Finalmente,  las  componentes 
T{L  se  pueden  identificar  con  el  tensor  de  momento  electromagnético  (1.45),  que  describe  el 
flujo  de  momento  del  campo  electromagnético.  En  lenguaje  covariante,  la  densidad  de  energía, 
el  vector  de  Poynting  y el  tensor  son  componentes  distintas  del  mismo  tensor  . . 

Si  calculamos  la  divergencia  del  tensor  de  energía-momento  (9.9)  utilizando  las  leyes  de  Max- 
well, vemos  que  en  presencia  de  cargas  y corrientes  la  divergencia  no  es  cero,  sino  (ejerc.) 

^T(Z)  = j,F^.  (9.11) 

Dado  que  antes  hemos  interpretado  dltrr,n'  = 0 como  la  ley  de  conservación  de  energía  y de 
momento,  está  claro  que  (9.11)  implica  que  la  energía  y el  momento  del  campo  electromagnético 
no  se  conserva,  por  lo  menos  no  en  presencia  de  cargas  y corrientes.  Esto  es  lógico,  puesto  que 
el  campo  electromagnético  interacciona  con  las  partículas  cargadas  y es  capaz  de  acelerarlas  y 
cambiar  su  energía  y su  momento. 

Efectivamente,  escribiendo  (9.11)  en  lenguaje  tridimensional  vemos  que  la  componente  tem- 
poral se  traduce  como 

0 = 5o T(°e°m)  + - jiF 01 

= ha t(E2  + B2)  + V • (É  x B)  + J ■ É 

= ^(Sem+^cin)  + V • S,  (9.12) 

donde  en  la  última  igualdad  hemos  utilizado  que  el  cambio  en  energía  cinética  Ec¡n  de  las  partícu- 
las cargadas  es  justo  el  trabajo  realizado  por  el  campo  eléctrico.  A través  de  (3.26)  tenemos  que 

= v-F  = = j-É.  (9.13) 

a 

La  ecuación  (9.12)  dice  por  lo  tanto  que  el  cambio  de  energía  total  en  un  volumen,  siendo  la  suma 
de  la  energía  del  campo  electromagnético  y la  energía  cinética  de  las  partículas  cargadas,  es  igual 
al  flujo  de  energía  a través  de  la  superficie.  En  otras  palabras,  en  presencia  de  cargas  y corrientes, 
la  energía  del  campo  electromagnético  no  se  conserva,  pero  la  energía  total  (la  electromagnéctica 
y la  de  la  materia)  sí. 

Del  mismo  modo  podemos  interpretar  la  componente  espacial  de  (9.11)  como  la  ley  de  con- 
servación de  momento  total: 

0 = do T°:m)  + dkT^m)  - j0F0i  - jkFki 
= dtSi  + dkTik  + pEi  + eikljkBi 

= dt  (Si  + ]T(Pa)¿)  + dkTik,  (9.14) 

a 

donde  en  la  última  igualdad  hemos  escrito  la  fuerza  de  Lorentz  (3.35)  como  el  cambio  de  momen- 
to de  las  partículas  cargadas,  a través  de  la  segunda  ley  de  Newton  (3.24).  Por  lo  tanto,  el  cambio 
de  momento  del  campo  electromagnético  más  el  cambio  de  momento  de  las  partículas  es  igual  al 
flujo  de  momento  por  la  superficie,  de  modo  que  la  cantidad  total  de  momento  se  conserva. 

Por  lo  tanto,  la  divergencia  del  tensor  de  energía-momento  (9.9)  del  campo  electromagnético 
no  es  cero,  porque  no  describe  un  sistema  cerrado,  sino  uno  que  interacciona  con  las  partículas  (o 
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los  campos)  cargadas,  que  también  contribuyen  al  tensor  de  energía-momento  total.  El  sistema 
total  está  descrita  por  el  lagrangiano  completo. 


C = C, 


C 


(carga) 


+ C 


(interacc)  ? 


(9.15) 


que  consiste  de  un  término  que  describe  la  dinámica  del  campo  electromagnético,  uno  que  des- 
cribe la  dinámica  de  los  campos  cargados  y un  término  de  interacción.  En  la  sección  9.3  veremos 
que  cada  uno  de  estos  términos  contribuye  al  tensor  de  energía-momento  total, 

= T/“\  + Tr  , + T,rt  (9.16) 

(tot)  (em)  (carga)  (interacc)’  v ' 

que  está  conservado  en  su  totalidad,  = 0,  pero  las  interacciones  entre  los  distintos  secto- 

res de  la  teoría  hacen  que  no  se  conservan  los  tensores  de  energía-momento  de  cada  sector  por 
separado. 


9.2.  Las  ecuaciones  de  Einstein 


Resumamos  la  situación  hasta  ahora:  por  un  lado  sabemos  del  Principio  de  Equivalencia 
que  la  gravedad  es  una  manifestación  de  la  curvatura  del  espacio,  es  decir,  de  una  propiedad 
geométrica  del  espaciotiempo.  Por  otra  lado  sabemos  que  la  fuente  de  esta  curvartura  es  la  mate- 
ria de  la  cual  tenemos  una  descripción  tensorial,  el  tensor  de  energía-momento.  Pero  todavía  no 
sabemos  exactamente  cómo  la  materia  interacciona  con  el  espaciotiempo.  Esta  interacción  viene 
dada  por  las  ecuaciones  de  Einstein. 

La  pregunta  ahora  claramente  es:  ¿Cuál  es  la  forma  exacta  de  las  ecuaciones  de  Einstein?  En 
otras  palabras,  ¿cómo  podemos  describir  de  manera  cualitativa  la  interacción  entre  el  espacio- 
tiempo  y la  materia?  El  Principio  de  Covariancia  nos  dice  que  la  ecuación  debe  ser  válida  en 
todos  los  sistemas  de  referencia,  y que  por  lo  tanto  debe  tener  una  forma  tensorial.  Concretamen- 
te, la  ecuación  de  Einstein  tiene  que  ser  de  la  forma 

Gpv  = -kT^,  (9.17) 

donde  G es  un  tensor  que  describe  la  curvatura  del  espacio,  7’;J1/  el  tensor  de  energía-momento 
y k una  constante  de  proporcionalidad  (introducimos  el  signo  menos  para  futura  conveniencia). 

La  pregunta  por  lo  tanto  se  reduce  a la  identificación  del  tensor  G';„, . Resulta  que  hay  diversas 
restricciones  matemáticas  y físicas  que  G tiene  que  cumplir: 

1.  G/IU  tiene  que  ser  simétrico  en  los  dos  índices,  ya  que  7),,,  también  lo  es. 

2.  G/u/  tiene  que  ser  un  objeto  puramente  geométrico.  Por  lo  tanto,  tiene  que  ser  una  función 
solamente  de  la  métrica  gpl,  y sus  derivadas. 

3.  Para  el  espacio  plano,  tenemos  que  G ¡¡v  = 0. 

4.  La  ley  de  conservación  de  energía  = 0 implica  que  también  V/,  G,,,!/  = 0. 

5.  Se  puede  identificar  la  componente  <700  de  la  métrica  con  el  potencial  gravitacional  new- 
toniano  (véase  sección  10.1).  Para  tener  una  teoría  dinámica  y para  recuperar  la  ecuación 
de  Poisson  (5.58),  O jn,  debe  contener  segundas  derivadas  de  la  métrica.  La  manera  más 
natural,  por  lo  tanto  es  a través  de  las  contracciones  del  tensor  de  Riemann  RPvPx. 

6.  Para  obtener  una  ecuación  diferencial  de  segundo  orden  (y  no  más)  en  los  potenciales  gra- 
vitatorios,  Gpu  tiene  que  ser  lineal  en  el  tensor  de  Riemann.  Contracciones  del  tipo  Rpf>  li,/‘ 
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ó Rv,P\crRvpXcr  darían  lugar  a ecuaciones  diferenciales  de  orden  más  alto  que  2.1 

Posibles  candidatos  más  o menos  obvios  para  Gp„  podrían  ser  la  misma  métrica  g/JV,  su 
d'Alambertiano  VpVpgp„  o el  tensor  de  Ricci  R,,v,  pero  pensando  un  poco  uno  se  da  cuenta  en 
seguida  de  que  ninguna  de  estas  posibilidades  cumple  todas  las  condiciones  mencionadas  arriba. 
Aunque  la  métrica  tiene  el  rango  y las  simetrías  adecuadas  y satisface  la  condición  Vp.c/P"  = 0, 
tiene  la  desventaja  de  que  no  cumple  la  condición  5:  la  ecuación  gt,M  = —kTijm  no  es  una  ecuación 
dinámica,  ni  mucho  menos  recupera  la  ecuación  de  Poisson  (5.58).  El  d'Alambertiano  VpVpgp„ 
sufre  del  problema  opuesto,  ya  que  satisface  (casi)  todas  las  condiciones,  pero  es  idénticamente 
cero,  por  el  hecho  de  que  la  conexión  de  Levi-Civita  es  compatible  con  la  métrica,  como  conta- 
mos en  la  sección  7.6.  Finalmente,  R^  no  satisface  la  condicón  4,  sino  Vp  RJ"'  = \d,y  ¡i,  como 
vimos  en  (7.56).  Por  lo  tanto,  la  ley  de  conservación  de  energía  impondría  que  las  únicas  métricas 
permitidas  serían  las  que  tienen  d^R  = 0,  lo  que  no  es  una  realista  de  esperar.2 

En  realidad  las  condiciones  1-6  determinan  el  tensor  G ¡lv  unívocamente:  se  puede  demostrar 
que  la  expresión  más  general  para  un  tensor  simétrico  de  rango  (0,  2),  construido  de  la  métrica  y 
sus  derivadas  y lineal  en  Rltu/,\  es,  salvo  una  constante  común,  de  la  forma 

G fu/  = Rpii  cxgpi/R  A g^ A(x),  (9.18) 

con  a una  constante  y A(x)  una  función  escalar  con  dimensiones  de  masa/ (longitud)3.  Exigir  que 
= 0 implica  que  a = —1/2  y que  A es  una  constante,  mientras  que  exigir  que  Gp„  = 0 
para  el  espacio  plano  implica  que  A = 0.  Por  lo  tanto  el  único  tensor  que  satisface  todas  las 
condiciones  necesarios  es  el  tensor  de  Einstein,  introducido  en  (7.35), 

GpV  = R,lv  - -gpuR-  (9.19) 

Una  comparación  con  las  fórmulas  newtonianas  (vease  sección  10.1)  fija  la  constante  de  pro- 
porcionalidad n = SttG/y,  donde  G y es  la  constante  de  Newton,  de  modo  que  las  ecuaciones  de 
Einstein  vienen  dadas  por 


Rfiv  ^^Jñ^R  87 TGjyTpv. 


Las  ecuaciones  de  Einstein  forman  un  sistema  de  10  ecuaciones  diferenciales  parciales  no- 
lineales  acopladas  de  segundo  orden,  lo  que  hace  que  sean  muy  difíciles  de  resolver  analítica- 
mente. No  hay  técnicas  conocidas  para  obtener  una  solución  general.  Todas  las  soluciones  cono- 
cidas son  casos  con  mucha  simetría  u obtenidas  a través  de  técnicas  específicas.  Comentaremos 
más  sobre  este  asunto  en  el  Capítulo  11. 

Las  ecuaciones  de  Einstein  tiene  10  componentes,  pero  en  realidad  la  condición  Vp.G',í"  = 0 
impone  4 ligaduras,  de  modo  que  sólo  6 ecuaciones  son  realmente  independientes.  Esto  implica 
que  de  las  10  componentes  de  la  métrica  sólo  6 están  determinadas  por  las  ecuaciones  de  Einstein 
y corresponden  a grados  de  libertad  físicos.  Las  otras  4 componentes  son  componentes  no-físicas 
que  expresan  la  libertad  de  elección  de  sistema  de  coordenadas.  Si  g p„  es  una  solución  de  (9.20) 

JEn  1938,  el  físico  húngaro  Cornelius  Lanczos  (1893  - 1977)  demostró  que  la  variación  del  Lagrangiano  de  Gauss- 
Bonnet, 

C = V\F\(r2  ~ 4 + Rp.pxR^^) , 

también  da  lugar  a ecuaciones  diferenciales  de  segundo  orden.  Sin  embargo  en  cuatro  dimensiones  el  término  de  Gauss- 
Borrnet  es  un  término  topológico  (es  la  característica  de  Euler  cuadrimensional)  y por  lo  tanto  no  contribuye  a las  ecua- 
ciones de  movimiento.  La  acción  que  consideró  Lanczos  sí  contribuye  a la  dinámica  en  5 o más  dimensiones. 

2En  1915,  no  mucho  antes  de  dar  con  la  versión  correcta,  Einstein  propuso  Rpv  = para  la  ecuaciones  adecuadas 

para  la  gravedad.  Einstein  mismo  se  autocriticó  de  manera  irónica:  "Este  tipo  hace  lo  que  le  conviene.  Cada  año  retira  lo 
que  escribió  en  año  anterior." 
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expresada  en  coordenadas  xJ‘ , las  misma  métrica  gns  expresada  en  coordenadas  ya  también  de- 
bería ser  una  solución.  Esto  sólo  es  posible  si  la  métrica  contiene  4 grados  de  libertad  que  no  están 
determinados  por  las  ecuaciones  de  Einstein  y que  representan  la  libertad  de  aplicar  un  cambio 
de  coordenadas  x/1  — » ya  = ya(xfJ’).3 

Esto  es  muy  similar  a los  grados  de  libertad  del  potencial  A „ en  la  teoría  de  Maxwell:  aun- 
que A/t  tiene  4 componentes,  la  relación  de  dispersión  (3.32)  y la  libertad  de  elección  de  gauge 
A’^  = A^  + d;,  A imponen  dos  condiciones,  de  modo  que  el  potencial  sólo  tiene  2 grados  de  li- 
bertad físicos.  La  libertad  de  elección  de  gauge  en  electromagnetismo  y la  libertdad  de  elección 
de  sistema  de  coordenadas  en  relatividad  general  tienen  muchas  analogías  (véase  Capítulo  ??). 
Igual  que  en  electromagnetismo  se  puede  eleminar  esta  libertad  fijando  el  gauge  (por  ejemplo 
el  gauge  de  Lorenz  O^  A1'  = 0),  en  relatividad  general  se  puede  fijar  el  sistema  de  coordenadas 
imponiendo  unas  condiciones  sobre  la  métrica  (por  ejemplo  la  condición  cjo ^ para  coorde- 

nadas localmente  inerciales).  En  ambos  casos  lo  que  uno  está  haciendo  es  imponer  condiciones 
sobre  los  grados  de  libertad  no-físicos. 

La  gran  diferencia  conceptual  entre  las  ecuaciones  de  Einstein  y la  teoría  newtoniana  de  la 
gravedad  es  que  las  ecuaciones  de  Einstein  describen  la  gravedad  como  una  teoría  de  campos. 
En  el  Capitulo  1 hemos  visto  que  el  concepto  de  campo  físico  fue  introducido  por  Faraday  y 
aprovechado  por  Maxwell  en  el  contexto  del  electromagnetismo,  para  resolver  el  problema  de 
la  acción  a distancia.  Donde  en  la  ley  de  Newton  o de  Coulomb  las  partículas  tienen  interac- 
ciones (gravitacionales  o electromagnéticas)  a distancia,  en  una  teoría  de  campos  las  partículas 
interaccionan  indirectamente,  a través  de  un  campo  que  se  extiende  por  el  espacio  y que  sirve  de 
intermediario  para  la  interacción  entre  las  partículas.  Una  perturbación  se  transmite  a través  del 
campo  a velocidad  finita  (la  velocidad  de  la  luz  en  el  caso  del  electromagnetismo  y la  gravedad). 
De  este  modo  la  relatividad  general  resuelve  el  problema  de  acción  inmediata  y a distancia  en  la 
gravedad  newtoniana,  comentado  en  la  sección  5.4. 

Pero  también  hay  una  gran  diferencia  conceptual  entre  la  teoría  de  Maxwell  y la  relatividad 
general.  En  la  teoría  de  Maxwell  el  campo  intermediario  es  el  campo  electromagnético  f j,,,  (o  los 
potenciales  A M),  que  viven  en  un  espaciotiempo  específico,  generalmente  Minkowski  (aunque  no 
necesariamente).  Sin  embargo  en  relatividad  general,  el  campo  intermediario  es  justamemente  la 
métrica  y;,„,  el  tensor  que  resume  todas  las  propiedades  geométricas  del  espaciotiempo.  Esto  no 
sólo  implica  que  el  espaciotiempo  es  algo  dinámico,  que  interacciona  con  la  materia  y consigo 
mismo,  sino  también  que  la  geometría  no  está  fija  y a priori  determinada.  En  contraste  con  la 
teoría  de  Maxwell  (o  sus  generalizaciones,  como  Yang-Mills  o el  Modelo  Estándar),  en  relativi- 
dad general  el  espaciotiempo  no  es  un  escenario  estático  dentro  del  cual  ocurre  la  física,  sino  que 
es  una  parte  activa  del  juego.  En  cierto  modo,  en  la  relatividad  especial  el  espacio  de  Minkowski 
era  un  espaciotiempo  absoluto,  en  el  sentido  de  que  no  se  contempla  la  posibilidad  de  otra  geo- 
metría, ni  de  que  se  vuelva  dinámico.  Aquí  la  geometría  no  está  determinada  a priori,  sino  por 
el  contenido  de  energía  y materia  y por  las  condiciones  iniciales.  Donde  la  relatividad  especial 
eliminó  el  fantasma  del  espacio  y el  tiempo  absoluto,  la  relatividad  general  acabó  con  la  idea  del 
espaciotiempo  estático  y la  geometría  dada  a priori. 

A veces  es  útil  rescribir  las  ecuaciones  de  Einstein  sin  la  traza  . Tomando  la  traza  de  (9.20),  es 
decir  contrayendo  con  g,ÍV , encontramos 


R = kT,  (9.21) 

donde  T = g,lvTllv  y hemos  utilizado  que  gIUJ  gln/  = 4 en  4 dimensiones.  Sustituyendo  esto  en 

3Es  justo  debido  a esta  dificultad  técnica  que  Einstein  dudaba  si  covariancia  general  era  compatible  con  causalidad. 
En  particular  le  preocupaba  que  unas  ecuaciones  covariantes  no  determinan  por  completo  la  forma  de  la  métrica  a partir 
de  unas  condiciones  iniciales.  Hoy  en  día  sabemos  que  esta  indeterminación  no  es  debida  a una  falta  de  determinismo, 
sino  que  es  una  consecuencia  de  la  libertad  inherente  de  hacer  cambios  generales  de  coordenadas:  los  grados  de  libertad 
físicas  de  la  métrica  si  están  determinadas  por  las  ecuaciones  de  Einstein  y las  condiciones  iniciales,  pero  éstas  nunca 
pueden  determinar  qué  sistema  de  coordenadas  vamos  a usar  para  describir  la  solución. 
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(9.20)  vemos  que  las  ecuaciones  de  Einstein  sin  traza  son  de  la  forma 

R,,.v  = -k  (tijv  - ^9/ívT)  . (9.22) 

Esta  ecuación  es  completamente  equivalente  a (9.20),  pero  es  un  poco  más  fácil  a la  hora  de  buscar 
soluciones,  ya  que  no  hace  falta  calcular  el  escalar  de  Ricci  R.  Históricamente,  esta  es  la  forma 
original  en  que  Einstein  escribió  las  ecuaciones,  aunque  su  forma  más  famosa  es  sin  duda  (9.20). 

Una  de  las  ventajas  de  (9.22)  es  que  en  el  vacío,  donde  7),,,  = 0,  las  ecuaciones  se  reducen  a 

R»v  = 0.  (9.23) 

Obviamente  el  espacio  de  Minkowski  es  una  solución  de  esta  ecuación  (la  condión  3 sobre  G /u/), 
pero  (9.23)  también  es  suficientemente  complicado  para  admitir  soluciones  no-triviales,  como  la 
solución  de  Schwarzschild  o de  ondas  gravitacionales.  Las  soluciones  de  (9.23)  son  en  cierto  mo- 
do el  análogo  de  las  ondas  electromagnéticas  en  teoría  de  Maxwell,  que  también  son  soluciones 
de  las  ecuaciones  en  el  vacío.  Las  métricas  que  tienen  la  propiedad  (9.23)  se  llaman  Ricci-planas. 

Finalmente,  antes  hemos  visto  que  la  forma  más  general  de  un  tensor  simétrico  de  rango  2, 
linear  en  R1lvp\  es  de  la  forma  (9.18)  y que  la  condición  de  que  6';íl,  fuera  cero  para  el  espacio 
plano  fijaba  el  valor  de  la  constante  A en  cero.  Si  aflojamos  esta  última  condición  y no  exigimos 
encontrar  el  espacio  de  Minkowski  entre  las  posible  soluciones,  vemos  que  aparece  un  paráme- 
tro nuevo  en  las  ecuaciones:  la  constante  cosmológica  A.  La  constante  cosmológica  no  apareció  en 
la  primera  publicación  de  Einstein,  sino  que  la  introdujo  cuando  empezaba  a interesarse  por  la 
cosmología,  con  el  fin  de  obtener  un  universo  estático.  El  valor  de  la  constante  cosmológica  no 
está  determinado  por  la  teoría  y representa  una  fuerza  universal  repulsiva  si  A > 0 y atractiva 
si  A < 0.  Se  la  puede  interpretar  como  la  energía  del  vacío  y muchas  veces  se  la  considera  par- 
te del  tensor  de  energía-momento,  más  que  de  la  parte  geométrica  de  la  ecuación  de  Einstein. 
Efectivamente  el  tensor  de  energía-momento  correspondiente  sería 

T (9.24) 

en  otras  palabras  un  fluido  perfecto  con  A = p = —P.  Observaciones  cosmológicas  recientes  pa- 
recen sugerir  que  en  nuestro  universo  la  constante  cosmológica  tiene  un  pequeño  valor  positivo 
y forma  un  70%  del  contenido  de  energía  del  universo  (véase  Capítulo  ??). 


9.3.  Física  en  espacios  curvos  y la  acción  de  Einstein-Hilbert 

Hemos  visto  que  las  ecuaciones  de  Einstein  (9.20)  nos  dicen  cómo  la  materia  y la  energía 
determinan  la  curvatura  del  espaciotiempo,  pero  no  dicen  nada  sobre  la  dinámica  de  la  materia  y 
los  campos  no-gravitacionales.  Obsérvese  que  (9.20)  es  una  ecuación  diferencial  para  gIJV,  donde 
aparece  como  un  término  inhomogéneo,  no  como  algo  dinámico.  Lo  que  nos  gustaría  tener 
es  una  generalización  a espacios  curvos  de  la  dinámica  relativista  de  la  sección  3.3,  es  decir  de  la 
Segunda  Ley  de  Newton  y de  la  teoría  de  Maxwell. 

El  Principio  de  Covariancia  dice  que  las  leyes  de  la  física  en  un  espacio  curvo  tienen  que  trans- 
formar bien  bajo  cambios  generales  de  coordenadas,  es  decir  tienen  que  estar  escritas  en  términos 
de  derivadas  covariantes,  en  lugar  de  derivadas  parciales.  Y el  Principio  de  Equivalencia  dice  que 
las  leyes  tienen  que  ser  de  tal  forma  que  en  las  coordenadas  localmente  inerciales  tienen  que  re- 
cuperar la  forma  de  la  relatividad  especial.  Pero  aún  así  hay  muchas  maneras  de  generalizarlas. 
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Por  ejemplo  cualquiera  de  las  expresiones 

V„F^  = j 


V^  + V^ñ/FW=j", 

V,F'“'  + R^xvVxF^  = f + R^j», 


(9.25) 

es  una  expresión  covariante  que  se  reduce  en  el  espacio  de  Minkowski  a la  ley  de  Maxwell 
¿)IL  FinJ  = jv . Sin  embargo,  físicamente  no  son  equivalentes,  por  el  hecho  de  que  tienen  acoplos 
distintos  entre  los  campos  electromagnéticos  y la  métrica  y la  curvatura. 

¿Cómo  sabemos  cuál  de  estas  generalizaciones  es  la  correcta?  Verificación  experimental,  por 
supuesto,  ya  que  las  distintas  generalizaciones  no  son  equivalentes.  Pero  comprobar  experimen- 
talmente la  diferencia  entre  estas  ecuaciones  es  muy  difícil,  puesto  que  para  campos  gravitatorios 
no  muy  fuertes,  los  términos  proporcionales  a los  tensores  de  curvatura  son  muy  pequeños.  Es- 
taría bien  si  hubiera  algún  principio  físico  que  nos  diera  una  prescripción  para  generalizar  las 
fórmulas  de  relatividad  especial. 

El  Principio  de  Mínimo  Acoplo  es  lo  más  parecido  a lo  que  uno  puede  aspirar  de  tal  prescrip- 
ción. Estrictamente  hablando  no  es  un  principio  físico,  sino  más  bien  un  principio  filosófico,  una 
variante  de  la  Navaja  de  Ockham.  Básicamente,  el  Principio  de  Mínimo  Acoplo  supone  que  la 
generalización  más  sencilla  es  la  correcta. 


Principio  del  Mínimo  Acoplo  (formulación  física):  En  un  espacio  curvo,  los  campos 
no-gravitacionales  se  acoplan  solamente  a la  métrica,  no  al  tensor  de  Riemann  o sus  contrac- 
ciones. 


Por  lo  tanto,  la  prescripción  para  generalizar  las  leyes  de  la  físcia  a espacio  curvos  es  muy 
simple  y concreta: 


Principio  del  Mínimo  Acoplo  (formulación  práctica):  Las  leyes  de  la  física  en  espa- 
cios curvos  son  los  mismos  que  las  de  relatividad  especial,  donde  se  sustituyen  las  derivadas 
parciales  d por  covariantes  y la  métrica  de  Minkoivski  por  una  métrica  general  g^v. 


Como  ya  dijimos,  no  hay  una  razón  física  fundamental  que  justifique  este  principio,  pero  es 
atractivo  por  su  sencillez.  Sin  embargo,  merece  la  pena  enfatizar  que  sólo  es  una  idea  elegante 
y que  hay  que  aplicarla  con  mucha  cautela.  En  particular  la  prescripción  no  siempre  es  unívoca, 
como  por  ejemplo  en  el  caso  del  operador  . En  el  espacio  de  Minkowski  no  importa  el  orden 
de  las  derivadas,  pero  al  sustituirlas  por  derivadas  covariantes  si  hay  diferencia  entre  VMV„  y 
WVW fj,  debido  a (7.47). 

Aún  así,  el  Principio  de  Mínimo  Acoplo  es  suficientemente  fuerte  como  para  poder  aplicarlo 
en  la  mayoría  de  los  casos.  Por  ejemplo  la  segunda  ley  de  Newton  para  una  partícula  libre  = 0 
se  convierte  en 

lo  que  es  justamente  la  ecuación  (7.36)  para  una  geodésica.  En  otras  palabras,  en  un  espacio  curvo, 
una  partícula  sobre  la  cual  no  actúa  ninguna  fuerza  aparte  de  la  gravedad  (es  decir,  una  partícula 
libre)  se  mueve  a lo  largo  de  las  geodésicas  del  espacio.  Si  la  partícula  si  está  sometida  a fuerzas 
externas  f11  (no-gravitacionales),  la  segunda  ley  de  Newton  tiene  la  forma 

mofx^+r^d/j  = r.  (9.27) 
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De  la  misma  manera  podemos  generalizar  la  teoría  de  Maxwell  a espacios  curvos.  Las  leyes 
de  Maxwell  vienen  dadas  por 

= f,  VpFup  + VpiV  + V„Fpp  = 0,  (9.28) 

aunque  la  simetría  de  la  conexión  de  Levi-Civita  y la  antisimetría  de  F^  permiten  rescribir  la 
ecuación  homogénea  como  (ejerc.) 

dpFvp  + dpFpV  + duFpil  = 0,  (9.29) 

donde  \g\  es  el  valor  absoluto  del  determinante  de  la  métrica. 

La  ecuación  homogénea  (9.29)  tiene  la  misma  forma  que  en  el  espacio  de  Minkowski  (5.49)  y 
sugiere  por  lo  tanto  que  el  tensor  electromagnético  sigue  teniendo  la  misma  forma  con  derivadas 
parciales,  Fpv  = dp  A „ — dvAp.  Efectivamente  debido  a la  simetría  de  la  conexión  y la  antisimetría 
del  tensor  electromagnético  tenemos  que 

Fp,u  = — 

= dpAu  — TPp„Ap  — dvAp  + TPpAp 

= dpAv  - dvAp.  (9.30) 


De  la  mecánica  analítica  sabemos  las  ventajas  del  formalismo  lagrangiano:  variando  con  res- 
pecto a los  grados  de  libertad  se  sacan  las  ecuaciones  de  movimiento,  de  modo  que  el  lagrangiano 
en  cierta  forma  es  un  resumen  de  la  dinámica  del  sistema  o de  la  teoría.  Además  muchas  veces 
es  más  sencillo  encontrar  las  simetrías  del  sistema  en  el  lagrangiano  que  en  las  ecuaciones.  Sería 
por  lo  tanto  interesante  encontrar  un  lagrangiano  cuyas  ecuaciones  de  movimiento  fuesen  justo 
las  ecuaciones  Newton,  de  Einstein  y de  Maxwell. 

No  es  muy  difícil  encontrar  una  acción  que  nos  proporcione  la  segunda  ley  de  Newton  (9.27), 
por  lo  menos  en  el  caso  donde  las  fuerzas  externas  son  conservativas.  Utilizando  la  expresión 
(7.52)  para  la  relación  entre  la  conexión  de  Levi-Civita  y la  métrica,  es  fácil  de  ver  que  la  ecuación 
de  Euler-Lagrange  de  xp  de  la  acción 


S = 


dr 


- -V{xllx11) 


(9.31) 


da  justamente  la  segunda  ley  de  Newton  (9.27)  con  ft,  = —d¡,V  (ejerc.). 

Una  acción  para  las  ecuaciones  de  Einstein  es  un  poco  más  difícil  de  encontrar.  Concentrémos- 
nos  primero  en  el  caso  más  sencillo  de  las  ecuaciones  del  vacío,  donde  el  tensor  de  energía- 
momento  es  cero.  Una  acción  para  este  caso  no  fue  encontrado  por  Einstein,  sino  por  el  ma- 
temático David  Hilbert  (1862  - 1942)  y enviado  junto  con  las  ecuaciones  de  Einstein  a una  revista, 
5 días  antes  de  que  el  propio  Einstein  enviara  el  artículo  en  el  que  por  fin  daba  con  la  versión  co- 
rrecta de  sus  ecuaciones.  La  acción  de  Einstein-Hilbert,  que  genera  las  ecuaciones  de  Einstein  para 
el  vacío,  viene  dada  por 

S = j- J d4x  V\g\  R,  (9-32) 

donde  R es  el  escalar  de  Ricci,  definido  en  (7.34). 

En  principio  se  obtienen  las  ecuaciones  de  Einstein  (9.20)  a través  de  la  variación  de  la  acción 
(9.32)  con  respecto  a la  métrica  inversa  g1"' . Sin  embargo,  en  la  práctica  este  método  es  muy 
complicado.  Nótese  que  el  escalar  de  Ricci  es  cuadrático  y de  primer  orden  en  los  símbolos  de 
Christoffel, 

r = <r  (Vi  - dAri  + riri  - r¿„r^) , (9.33) 
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mientras  los  símbolos  de  Christoffel  a su  vez  son  cuadráticos  y de  primer  orden  en  la  métrica 

= \gpX  [d^g\v  + dvgp \ - d\ gpv^j , (9.34) 

de  modo  que  (9.32)  es  de  tercer  orden  en  g!'u . La  variación  de  S lleva  por  lo  tanto  a una  ecuación 
de  Euler-Lagrange  modificada,  de  cuarto  orden: 

dpd\(  ^ y)  — dp( ttk— — t]  + — = 0,  (9.35) 

p \S(dpdxg^)J  p\S(dpg^)J  Sg ^ 

donde  C es  el  lagrangiano  de  la  acción  de  Einstein-Hilbert  (9.32).  Estará  claro  que  calcular  explíci- 
tamente todos  las  componentes  de  (9.35),  aunque  posible,  no  es  en  la  práctica  un  método  viable. 

Afortunadamente  existe  un  truco,  llamado  el  formalismo  de  Palatini,  que  nos  permite  obtener 
las  ecuaciones  de  Einstein  de  manera  más  directa.  El  truco  consiste  en  suponer  por  un  momento 
que  la  conexión  en  el  escalar  de  Ricci  (9.33)  es  una  conexión  arbitraria,  no  necesariamente  la 
conexión  de  Levi-Civita  (9.34).  En  este  caso  no  hay  una  relación  entre  la  conexión  y la  métrica  y se 
considera  por  lo  tanto  los  Pí¡lIJ  como  un  campo  independiente.  La  acción  de  Einstein-Hilbert  tiene 
por  lo  tanto  sólo  dos  sitios  donde  aparece  la  métrica:  en  el  determinante  \/\g\  y en  la  contracción 
del  tensor  de  Ricci  R(T)  = g1"'  RinAd')-  La  variación  con  respecto  a g111'  es  entonces  muy  sencillo 

o = ^§7  = VW\[RpÁ  r)  - \g^gpxRPx(r)\ , (9.36) 

donde  el  primer  término  viene  de  la  variación  de  R y el  segundo  de  la  variación  del  determinante. 
Dividiendo  esta  igualdad  por  \/Jg\  se  tiene  directamente  las  ecuaciones  de  Einstein  (9.20)  para  el 
caso  de  7';,„  = 0.  Sin  embargo,  hay  otros  grados  de  libertad  más,  dado  que  hemos  considerado  la 
conexión  como  un  campo  independiente.  Tenemos  por  lo  tanto  que  calcular  todavía  la  variación 
de  la  acción  SS  bajo  variaciones  de  la  conexión  T?v  — > P£„  + ST^.  No  es  difícil  de  averiguar  que 
la  variación  de  la  acción  viene  dada  por 

ss  = ¿ / éx  ^1  gpv  [^(¿rL)  - vA(<sr¿„)  + i£A(¿r¿„)]  (9.37) 

gracias  a la  Identidad  de  Palatini 

5Rp,  = dp(STl)  - dx(6T ¿„)  + (ár^)r^  + r^(<5nj  - (¿r^rL  - r^(áTL) 

= vM(¿rt)  - vA(5r¿„)  + T^(sr^),  (9.38) 

donde  T°x  = T^A  — rA  es  el  tensor  de  torsión  (7.23)  (Nótese  que  de  momento  tratamos  la  co- 
nexión como  arbitraria,  y por  lo  tanto  no  necesariamente  simétrica).  Integrando  por  partes  los 
primeros  dos  términos,  podemos  reescribir  (9.37)  como  (ejerc.) 

5S  = hj d4x  ^ {^T^S  E-)  - [V"  + ^VTV^r  + g^a](STl) 

+ [vAír  + + 9^]^)},  (9.39) 

donde  hemos  utilizado  la  generalización  a conexiones  arbitrarias  de  (A.22)  (ejerc.), 

dPV\g\  = \V\g\g^dpg,v  = p9p„  + V\g\TxpX.  (9.40) 

Por  lo  tanto,  la  variación  de  la  acción  se  puede  escribir  como 

o = 55  = ¿ (¿Tp){-  + /t;]  íj 

+' v A gpv  + g^gaTVxg,r  + gpvT^a  + <r  } . (9.41) 
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El  hecho  de  que  la  variación  SS  tenga  que  ser  cero  para  cualquier  variación  STXV,  implica  que 
el  integrando  entre  los  corchetes  es  cero  y dado  que  los  términos  dentro  de  los  corchetes  con 
proporcionales  a la  derivada  covariante  de  la  métrica  y la  torsión,  una  solución  obvia  es 

T£x  = 0,  Vp9ltv  = 0.  (9.42) 

En  otras  palabras,  la  acción  es  estacionaria  bajo  variaciones  de  la  conexión,  si  la  torsión  y la 
derivada  covariante  de  la  métrica  son  cero.  Pero  la  simetría  la  conexión  y su  compatibilidad  con 
la  métrica  son  justamente  las  dos  condiciones  de  la  sección  7.6  que  determinan  unívocamente 
la  conexión  de  Levi-Civita.  emos  por  lo  tanto  que  la  conexión  de  Levi-Civita  surge  de  manera 
natural  en  la  relatividad  general  como  consecuencia  de  las  ecuaciones  de  movimiento  de  una 
conexión  general. 

Resumiendo  podemos  decir  que  el  formalismo  de  Palatini  trata  la  métrica  y la  conexión  co- 
mo a priori  independientes.  La  ecuación  de  movimiento  de  la  métrica  nos  da  las  ecuaciones  de 
Einstein,  mientras  la  ecuación  de  la  conexión  identifica  la  conexión  como  la  de  Levi-Civita.  Hasta 
ahora  sólo  hemos  aplicado  el  formalismo  de  Palatini  a la  acción  de  Einstein-Hilbert,  para  obtener 
las  ecuaciones  del  vacío,  pero  el  formalismo  se  aplica  de  igual  manera  a acciones  con  acoplos  a 
campos  no-gravitacionales.  La  variación  de  la  métrica  dará  las  ecuaciones  Einstein  acoplado  al 
tensor  de  energía-momento  y la  variación  de  la  conexión  dará  las  mismas  condiciones,  ya  que  los 
campos  no-gravitacionales  se  acoplan  a la  métrica  y no  a la  conexión.  En  la  práctica  por  lo  tanto 
podemos  olvidarnos  de  esta  última  variación  y suponer  directamente  que  la  conexión  es  la  de 
Levi-Civita,  variando  sólo  con  respecto  a y;,„. 


Finalemente,  para  obtener  también  las  ecuaciones  de  Maxwell  tenemos  que  generalizar  la 
acción  de  Einstein-Hilbert  a la  llamada  acción  de  Einstein-Maxwell 


S = 


dAxy/\g\ 


_L  fí  _ I p pa» 

12k  4 ^ 


(9.43) 


Obsérvese  que  las  contracciones  de  la  parte  electromagnética  están  hechas  a través  de  la  métrica 
general  gIJV,  de  acuerdo  con  el  Principio  de  Mínimo  Acoplo,  = gppguXFpjUFp\. 


La  variación  con  respecto  a g,LV  da  la  ecuación  de  Einstein  en  presencia  de  campos  electro- 
magnéticos (ejerc.) 

R¡iv  ~ T^g^vR  = k FPpFv  p — -g^Fp\FpX  , (9.44) 

mientras  la  ecuación  de  Euler-Lagrange  para  /1;,  , 


SC  \ 

wm) 


SC 

si: 


= o, 


(9.45) 


nos  proporciona  la  siguiente  expresión  para  la  ecuación  de  movimiento  el  campo  electromagnéti- 
co (ejerc.) 


1 

VW\ 


V¥í  Fpv 


= 0, 


(9.46) 


lo  que,  usando  la  simetría  de  la  conexión,  la  antisimetría  de  Fpv  y la  propiedad  (7.63),  pode- 
mos reescribir  como  la  ecuación  de  Maxwell  en  espacio  curvos  en  ausencia  de  fuentes,  en  forma 
explicitamente  covaraiante  (ejerc.), 

VpF^  = 0.  (9.47) 

Nótese  que  el  lado  derecho  de  la  ecuación  de  Einstein  es  justo  (salvo  un  signo)  el  tensor  de 
energía-momento  (9.9).  Esto  es  una  propiedad  general:  Dado  un  lagrangiano  C = £eh  + C,lt, 
que  consiste  de  la  acción  de  Einstein-Hilbert  (9.32)  más  los  términos  C^,  que  describen  la  dinámi- 
ca de  un  campo  <f>  que  interacciona  con  la  gravedad,  entonces  el  tensor  de  energía-momento  de  ó 
se  puede  obtener  a través  de  una  variación  de  C,¡,  con  respecto  a gpu: 


, 2 S(xAi\£s) 


(9.48) 
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Figura  9.1:  La  estructura  causal  del  espacio  de  Minkowski:  Dos  observadores  O y O'  están  continuamente 
en  contacto  causal.  Un  evento  p en  la  historia  de  O influenciará  a O1  a partir  del  momento  q en  que  O'  entre 
en  el  cono  de  luz  de  p.  Equivalentemente  (pero  no  dibujado),  los  eventos  en  la  historia  de  O1  influenciarán 
a O desde  el  momento  en  que  éste  entra  en  su  cono  de  luz. 


Obsérvese  que  la  acción  de  Einstein-Maxwell  (9.43)  es  invariante  tanto  bajo  cambios  generales 
de  coordenadas  como  bajo  transformaciones  gauge. 


9.4.  La  estructura  local  y global  del  espaciotiempo 

Hemos  visto  que  las  ecuaciones  de  Einstein  (9.20)  relacionan  la  curvatura  del  espacio-tiempo 
con  el  contenido  de  energía  y materia  dentro  del  espacio  y que  la  relación  entre  ambas  cosas  es 
tal  que  a escalas  pequeñas  se  recuperan  las  leyes  de  la  relatividad  especial. 

Esto  implica  que,  por  lo  menos  localmente,  la  estructura  del  espaciotiempo  general  es  simi- 
lar a la  estructura  de  Minkowski.  Por  ejemplo,  aunque  en  general  la  métrica  tendrá  una  forma 
más  complicada,  la  signatura  siempre  será  (+,—,—,—),  es  decir,  el  espaciotiempo  siempre  es  lo- 
rentziano.  Por  lo  tanto,  igual  que  en  el  espacio  de  Minkowski,  podemos,  en  cualquier  punto  p, 
dividir  los  vectores  de  TP(M.)  en  tres  clases,  los  vectores  temporales,  nulos  y espaciales,  de- 
pendiendo de  si  la  norma  V 2 = es  positiva,  cero  o negativa.  Gracias  al  hecho  de  que 

V 2 es  un  escalar,  tendrá  en  mismo  valor  en  todos  los  sistemas  de  coordenadas,  de  modo  que  la 
clasificación  de  los  vectores  es  la  misma  para  todos  los  observadores. 

De  manera  análoga  al  espacio  de  Minkowski,  en  cualquier  punto  p se  puede  definir  el  cono  de 
luz  en  un  punto  p como  el  conjunto  de  vectores  nulos  V2(p)  = 0 y este  cono  de  luz  determina  la 
estructura  causal  del  espaciotiempo.  Pero  la  gran  diferencia  con  el  espacio  de  Minkowski  es  que, 
debido  a la  curvatura  del  espaciotiempo,  la  orientación  del  cono  de  luz  no  es  la  misma  en  todo 
el  espaciotiempo,  sino  que  varía  de  punto  en  punto.  La  interpretación  física  de  este  fenómeno  es 
que  la  gravedad  afecta  la  trayectoria  de  la  luz,  mientras  matemáticamente  hablando  es  debido  al 
hecho  de  que  las  coordenadas  localmente  inerciales  son  distintas  en  cada  punto  de  la  variedad. 

Una  partícula  masiva  seguirá  una  trayectoria  temporal,  que  se  define  como  una  curva  cuyos 
vectores  tangentes  son  temporales  en  todos  los  puntos  de  la  curva.  De  la  misma  manera  una 
partícula  sin  masa  seguirá  una  curva  nula.  Dos  eventos  p y q están  en  contacto  causal  si  están 
conectados  a través  de  una  curva  temporal  o nula.  Por  otro  lado,  si  entre  p y q no  existe  una  curva 
temporal  o nula,  no  es  posible  intercambiar  información  entre  los  dos  eventos  y se  dice  que  los 
eventos  están  fuera  de  contacto  causal. 

En  el  espacio  de  Minkowski,  un  evento  p en  la  historia  de  un  observador  O puede  llegar 
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Figura  9.2:  Horizontes  en  espacios  generales:  Las  partículas  1,2  y 3 están  inicialmente  en  contacto  causal, 
pero  a medida  que  pasa  el  tiempo  ya  no  es  posible  mandar  señales  de  luz  entre  los  observadores.  La  partícula 
1,  al  pasar  un  horizonte  de  sucesos  a,  entra  en  una  región  donde  la  luz  se  queda  atrapada,  debido  a un  fuerte 
campo  gravitatorio.  Por  otro  lado,  las  partículas  2 y 3 pierden  contacto  debido  a la  rápida  aceleración  del 
universo:  señales  emitidos  tarde  en  la  historia  no  llegan  nunca  de  un  observador  al  otro  y cada  observador 
tiene  un  horizonte  cósmico  b detrás  del  cual  no  puede  ver.  Las  partículas  1,2  y 3 no  reciben  influencias  de 
4 hasta  que  4 aparece  dentro  del  horizonte  de  partículas  c,  debido  a la  edad  finita  del  universo. 


a influenciar  tarde  o temprano  los  hechos  en  cualquier  posición  (x,  y , z)  del  espacio,  ya  que  el 
cono  de  luz  crece  con  el  paso  del  tiempo.  Cualquier  observador  O'  (siempre  y cuando  no  tenga 
aceleraciones  demasiado  grandes  con  respecto  a O)  está  continuamente  influenciado  por  O,  ya 
que  tarde  o temprano  entrará  en  el  cono  de  luz  de  cualquier  evento  p en  la  linea  de  universo  de 
O (véase  Figura  9.1).  Al  revés  también  es  verdad,  tarde  o temprano  O entrará  en  el  como  de  luz 
de  cualquier  evento  en  la  historia  de  O'.  Se  dice  que  estas  observadores  están  en  contacto  causal. 

Sin  embargo  en  un  espaciotiempo  general  esto  no  necesariamente  tiene  que  ser  cierto.  Debido 
al  hecho  de  que  la  orientación  de  los  conos  de  luz  varía  de  punto  o punto,  es  posible  que  unas 
partículas,  que  inicialmente  estaban  en  contacto  causal,  dejen  de  estarlo  después  de  un  cierto 
tiempo  (véase  Figura  9.2).  Si  un  observador  O entra  en  una  región  del  espacio  desde  la  cual  ya 
no  es  capaz  de  mandar  señales  de  luz  a un  observador  O'  fuera  de  esta  región,  decimos  que  el 
espaciotiempo  tiene  un  horizonte.  Existen  varios  tipos  de  horizones  y sólo  comentaremos  los  más 
comunes. 

Un  tipo  de  horizonte  surge  cuando  el  campo  gravitatorio  es  tan  fuerte  que  la  luz  se  queda 
atrapada.  En  términos  de  la  física  clásica  (newtoniana),  la  velocidad  de  escape  de  esta  región 
es  más  grande  que  la  velocidad  de  la  luz,  así  que  nada  que  entre  en  esta  región  puede  volver 
a escapar.  Este  tipo  de  horizonte  se  llama  un  horizonte  de  sucesos  y aparece  en  la  formación  de 
agujeros  negros  (véase  el  caso  a en  Figura  9.2).  Un  horizonte  de  sucesos  es  un  horizonte  absoluto, 
en  el  sentido  de  que  es  el  mismo  para  todos  los  observadores. 

Otro  tipo  de  horizonte  no  es  absoluto,  sino  que  depende  del  observador.  En  un  universo  en 
expansión,  la  expansión  puede  ser  tan  rápida  que  dos  observadores  "se  pierde  de  vista",  es  decir 
la  distancia  entre  los  dos  observadores  aumenta  demasiado  rápido  para  que  el  la  luz  emitida  por 
un  observador  llegue  al  otro.4  Para  cada  observador  hay  un  momento  en  su  historia  después  del 
cual  ya  no  es  capaz  de  recibir  señales  del  otro  y decimos  que  hay  un  horizonte  cósmico  (caso  b en 

ingenuamente  uno  podría  pensar  que  esto  implica  que  la  velocidad  relativa  entre  los  observadores  es  mayor  que  la 
velocidad  de  la  luz,  pero  recordemos  que  en  una  variedad  general,  la  velocidad  relativa  entre  dos  observadores  distantes 
no  está  bien  definida.  El  vector  velocidad  sólo  está  definido  en  el  espacio  tangente,  es  decir,  en  la  práctica  en  una  región 
pequeña  alrededor  de  la  partícula.  Las  velocidades  relativas  entre  partículas  sólo  están  definidas  para  partículas  cercanas. 
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la  Figura  9.2). 

Finalmente,  si  el  universo  tiene  una  edad  finita,  ningún  observador  puede  ver  más  alia  de  la 
distancia  que  ha  recordido  la  luz  desde  el  origen  del  universo  hasta  el  momento  de  observación. 
Desde  distancias  más  alia,  la  luz  simplemente  no  ha  tenido  tiempo  todavía  para  llegar  hasta  el 
observador,  aunque  sí  llegará  con  el  paso  del  tiempo.  El  horizonte  asociado  con  este  fenómeno 
se  llama  un  horizonte  de  partículas,  (caso  c en  la  Figura  9.2).  Horizontes  cósmicos  y horizontes  de 
partículas  son  muy  comunes  en  cosmología. 

Muchas  veces  la  métrica  que  surge  como  solución  de  las  ecuaciones  de  Einstein  es  singular 
en  cierta  región  del  espaciotiempo,  es  decir,  algunos  componentes  y/ o el  determinante  de  g 
tienden  a cero  ó a infinito.  En  este  caso  tenemos  que  distinguir  entre  dos  tipos  de  singularidades. 
El  primer  tipo  son  las  singularidades  de  coordenadas,  que  son  simplemente  artefactos  del  sistema 
de  coordenadas  que  utilizamos.  El  origen  en  coordenadas  esféricas  en  R3  es  un  ejemplo  de  una 
singularidad  de  coordenadas,  puesto  que  el  determinante  \g\  = r2  sin2  9 tiende  a cero  por  r — > 0, 
aunque  en  coordenadas  cartesianas  está  claro  que  el  origen  es  un  punto  completamente  regular. 

Una  singularidad  física  sin  embargo  es  una  singularidad  real,  un  punto  donde  la  curvatura  del 
espacio  es  infinita.  Cerca  de  una  singularidad  física,  el  campo  gravitatorio  es  muy  fuerte  y los 
efectos  de  marea  son  muy  grandes.  Los  físicos  británicos  Stephen  Hawking  (1942  - ) y Robert 
Penrose  (1931  - ) demostraron  en  los  años  60  que  en  el  interior  de  una  superficie  que  atrapa  la 
luz,  necesariamente  tiene  que  haber  una  singularidad  física,  de  modo  que  la  singularidad  en  el 
centro  de  agujeros  negros  es  física.  Por  otra  parte,  hay  una  conjectura,  llamada  el  censor  cósmico, 
de  que  cualquier  singularidad  física  siempre  está  rodeada  por  un  horizonte  de  sucesos,  de  modo 
que  la  singularidad  misma  no  es  visible  desde  fuera  y no  puede  influenciar  al  resto  del  universo 
y crear  problemas  de  causalidad.  Singularidades  que  no  están  rodeados  por  horizontes  se  llaman 
singularidades  desnudas. 

La  manera  general  para  distinguir  entre  singularidades  de  coordenadas  y singularidades  físi- 
cas es  calculando  los  invariantes  de  curvatura,  unas  funciones  escalares  formadas  de  contracciones 
del  tensor  de  Riemann,  como  R,  R,n/RIÍU , R^vp\  etc.  Si  los  invariantes  de  curvatura  son 

singulares,  entonces  la  singularidad  es  una  singularidad  física.  Por  otro  lado  si  los  invariantes 
son  regulares,  es  probable,  pero  no  seguro  que  la  singularidad  sea  de  coordenadas.  Nótese  que 
siempre  es  posible  que  un  invariante  todavía  no  calculado  se  haga  singular.  La  prueba  definitiva 
de  que  una  singularidad  sea  de  coordenadas  es  encontrar  un  cambio  de  coordenadas  que  hace 
desaparecer  la  singularidad. 

Las  ecuaciones  de  Einstein  son  ecuaciones  diferenciales  y tienen  por  lo  tanto  un  carácter  local. 
La  curvatura  en  cierto  punto  del  espaciotiempo  viene  dada  por  el  contenido  de  energía-momento 
en  este  punto  y una  pequeña  región  alrededor,  pero  la  geometría  global  puede  llegar  a tener  es- 
tructuras extrañas,  contraintuitivas  e incluso  patológicas.  Discutiremos  brevemente  unos  cuantos 
ejemplos. 

Una  primera  propiedad  geométrica  de  un  espaciotiempo  es  si  el  espacio  es  geodésicamente  com- 
pleto. Un  espacio  es  geodésicamente  completo  si  se  puede  extender  el  parametro  afín  de  cualquier 
geodésica  a infinito.  Intuitivamente  más  o menos  corresponde  con  la  propiedad  de  que  se  puede 
extender  todas  las  geodésicas  arbitrariamente.  Si  un  espacio  no  es  geodésicamente  completo,  sig- 
nifica que  algunas  geodésicas  terminan  en  un  punto  específico,  posiblemente  porque  acaban  en 
una  singularidad,  o porque  el  espaciotiempo  tiene  un  borde  con  que  se  choca  la  geodésica  (véase 
el  caso  a en  la  Figura  9.3). 

Una  siguiente  pregunta  que  uno  podría  hacer  es  si  un  espaciotiempo  dado  tiene  una  superfi- 
cie de  Cauchy,  es  decir  una  superficie  espacial,  que  podría  servir  para  especificar  las  condiciones 
iniciales,  de  modo  que  toda  la  evolución  posterior  esté  determinada  por  estas  condiciones  inicia- 
les. Si  uno  encuentra  una  superficie  E que  sea  espacial  en  todos  los  puntos  y especifica  en  esta 
superficie  las  posiciones  y velocidades  iniciales  de  las  partículas  y flujos,  no  está  garantizado  que 
para  cualquier  espaciotiempo  esta  superficie  E sea  una  superficie  de  Cauchy.  La  geometría  del 


148 


Figura  9.3:  Estructuras  no-locales  en  las  soluciones  de  las  ecuaciones  de  Elnstein:  un  espacio  es  geodésica- 
mente completo  si  cualquier  geodésica  se  extiende  hasta  el  infinito,  sino  acaba  en  un  borde  o una  singulari- 
dad (a).  No  en  todos  los  espacios  es  posible  definir  superficies  de  Cauchy,  ya  que  una  influencia  puede  venir 
del  infinito  sin  haber  cruzado  la  superficie  espacial  E (b).  Un  espacio  es  orientable  con  respecto  al  tiempo,  si 
hay  una  definición  global  de  la  dirección  en  que  fluye  el  tiempo  (c).  Curvas  temporales  cerradas  son  curvas 
que  son  temporales  en  todos  sus  puntos,  pero  que  vuelven  al  mimso  punto  y permiten  viajar  al  pasado  (d). 
Las  ecuaciones  de  Einstein  determinan  sólo  la  geometría  local,  pero  no  dicen  nada  sobre  la  topología  de  la 
solución  (e). 


espaciotiempo  puede  ser  así  que,  aún  especificando  condiciones  iniciales  en  E,  haya  curvas  tem- 
porales que  vengan  del  infinito  y que  no  crucen  la  superficie  E.  En  otras  palabras,  en  algunos 
espacios  es  posible  que  un  evento  en  el  futuro  de  la  superficie  E esté  influenciado  por  hechos  no 
especificados  en  las  condiciones  iniciales  (véase  el  caso  b en  la  Figura  9.3).  En  tales  espacios  no  se 
puede  calcular  el  futuro  del  espacio  entero,  sino  solo  de  trozos  pequeños  en  el  futuro  inmediato 
de  E.  El  espacio  de  anti-De  Sitter  es  un  ejemplo  de  un  espacio  donde  no  existen  superficies  de 
Cauchy. 

Otro  ejemplo  de  una  propiedad  geométrica  curiosa  es  la  orientabilidad  del  tiempo.  En  algu- 
nos espacios,  no  es  posible  definir  un  campo  vectorial  temporal  que  tenga  la  misma  orientación 
en  todo  el  espacio.  Intuitivamente  más  o menos  se  corresponde  al  hecho  de  que  no  haya  una  di- 
rección global  en  la  que  fluya  el  tiempo,  sino  que  en  distintas  regiones  del  espacio  el  tiempo  fluye 
en  direcciones  diferentes.  Concretamente,  si  en  tal  espacio  se  coge  una  foliación  con  superficies 
E k que  son  espaciales  en  todos  sus  puntos,  el  campo  vectorial  nJ1  ortogonal  a Efe  es  temporal  en 
todos  los  sitios.  En  espacios  que  no  son  orientables  con  respecto  al  tiempo  resulta  que,  aunque  se 
elija  nJ1  siempre  dirigido  hacia  el  futuro,  la  orientación  de  n,J  con  respecto  a Efe  no  es  la  misma 
en  todo  el  espacio.  En  algunas  regiones  n1'  estará  "por  un  lado"  de  Efe  y en  otras  regiones  por  "el 
otro  lado"  (véase  caso  c en  la  figura  9.3).  En  cada  punto  del  espacio  tenemos  una  estructura  loren- 
tziana  bien  definida,  con  una  dirección  temporal  bien  definida,  pero  globalmente  no  es  posible 
definir  un  sentido  global  para  una  dirección  temporal. 

Un  último  ejemplo  de  una  estructura  geométrica  contraintuitiva,  en  este  caso  incluso  patológi- 
ca, es  la  presencia  de  curvas  temporales  cerradas.  Ya  hemos  mencionado  que  una  curva  temporal 
puede  servir  como  posible  trayectoria  de  una  partícula  masiva.  En  principio  es  posible  que  la 
variación  de  la  orientación  de  los  conos  de  luz  de  punto  en  punto  sea  tal  que  existan  curvas  tem- 
porales cerradas,  es  decir,  que  sean  temporales  a lo  largo  de  toda  la  curva  y además  vuelvan  al 
mismo  punto  (véase  el  caso  d en  la  Figura  9.3).  Estas  curvas  temporales  cerradas  en  general  no 
son  geodésicas,  pero  en  principio  sería  posible  que  en  estos  espacios  un  observador  viajara  a su 
propio  pasado.  En  general  se  suelen  descartar  estas  soluciones  no  físicas,  por  los  probemas  lógi- 
cos relacionados  con  poder  influenciar  el  pasado,  pero  no  hay  nada  en  las  ecuaciones  de  Einstein 
que  impida  estas  soluciones.  Un  ejemplo  es  el  universo  de  Gódel. 

Finalmente,  merece  la  pena  enfatizar  que  las  ecuaciones  de  Einstein  determinan  la  métrica  g/n, 
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y por  lo  tanto  la  geometría  local  del  espacio,  pero  no  determinan  la  topología  de  las  soluciones, 
que  es  una  propiedad  global.  La  topología  del  espacio  viene  determinada  (entre  otras  cosas)  por 
las  condiciones  de  contorno,  cosa  que  no  entra  en  las  ecuaciones  de  Einstein,  sino  que  hay  que 
poner  a mano.  Dos  espacios  pueden  tener  la  misma  estructura  geométrica,  pero  una  topología 
distinta.  Un  ejemplo  muy  sencillo  es  el  caso  del  espacio  plano.  Tanto  el  espacio  de  Minkowski 
cuadrimensional  R1,3 

ds2  = dt 2 - dx 2 - dy2  - dz2  (9.49) 

como  el  producto  directo  del  espacio  de  Minkowski  bidimensional  con  el  toro  R1’1  x T 2 

ds2  = dt2  - dx2  - R\d62  - Rldip2 , (9.50) 

con  Ri  y i?2  los  radios  del  toro  y 0,  ip  £ [0, 2ir\,  son  soluciones  de  las  ecuaciones  del  vacío  y ambas 
son  planas,  ya  que  = 0.  A escalas  t R\.  R¿,  un  observador  no  es  capaz  de  ver  la  dife- 

rencia entre  estas  dos  soluciones,  ya  que  en  cada  punto  se  puede  hacer  el  cambio  de  coordenadas 
local  y = R\9,  z = R> y,  de  modo  que  las  métricas  de  las  dos  soluciones  son  la  misma.  Sin  em- 
bargo la  topología  es  muy  diferente.  Por  ejemplo,  cualquier  curva  en  R1,3  se  puede  contraer  a un 
punto,  mientras  que  una  curva  enroscada  a lo  largo  de  9 en  R1  d x T2  no  es  contraible.  En  gene- 
ral es  difícil  determinar  la  estructura  topológica  (como  la  presencia  de  asas  o ciclos  no-triviales, 
véase  el  caso  e en  la  Figura  9.3)  a base  de  la  métrica  g 
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Capítulo  10 

Los  tests  clásicos  de  la  relatividad 
general 


Si  la  Teoría  de  la  Relatividad  resulta  correcta , en  Alemania  dirán  que  soy  alemán,  en 
Suiza  que  soy  suizo  y en  Francia  que  soy  un  gran  científico.  Si  la  teoría  es  falsa,  para 
los  franceses  seré  un  suizo,  para  los  suizos  un  alemán  y para  los  alemanes  un  judio. 
(Atribuido  a A.  Einstein) 


En  los  últimos  dos  capítulos  hemos  desarollado  una  teoría  moderna  de  la  gravedad,  a base 
de  sólo  tres  principios:  el  Principio  de  Equivalencia,  el  Principio  de  Covariancia  y el  Principio  de 
Mínimo  Acoplo.  Estos  tres  principios  sencillos  y elegantes  llevan  directamente  a las  ecuaciones 
de  Einstein,  que  forman  el  núcleo  de  la  teoría  de  la  relatividad.  Pero  el  hecho  de  que  una  teoría 
sea  obtenida  de  manera  elegante,  a base  de  primeros  principios,  no  implica  que  sea  correcta,  es 
decir,  que  describa  bien  la  Naturaleza.  Al  fin  y al  cabo,  lo  que  determina  si  una  teo'ria  física  es 
correcta  o no,  son  los  resultados  expermentales.  Por  lo  tanto,  para  tener  un  poco  más  de  confianza 
en  la  teoría,  habrá  que  pasar  por  unas  cuantas  pruebas  experimentales. 


10.1.  El  límite  newtoniano 

Cuando  Einstein  en  1915  presentó  su  versión  final  de  la  relatividad  general,  no  había  nin- 
guna razón  experimental  para  dudar  de  la  validez  de  la  teoría  newtoniana  de  la  gravedad,  salvo 
quizá  el  desplazamiento  del  perihelio  de  Mercurio  (véase  la  sección  10.2).  Al  contrario,  entre  1841 
y 1845  los  astrónomos  John  Couch  Adams  (1819-1892)  en  Cambridge  y Urbain  Le  Verrier  (1811- 
1877)  en  París  utilizaron  independientemente  la  teoría  de  la  gravedad  newtoniana  para  predecir 
correctamente  la  posición  del  en  ese  momento  desconocido  planeta  Neptuno  a base  de  las  irre- 
gularidades en  el  movimiento  de  Urano,  un  hecho  que  entonces  fue  recibido  como  un  gran  éxito 
tanto  para  la  investigación  teórica  como  para  la  gravedad  newtoniana.  Por  lo  tanto,  si  la  relativi- 
dad general  pretende  ser  una  teoría  moderna  de  la  gravedad,  que  corrige  a la  teoría  newtoniana, 
más  vale  que  por  lo  menos  recupere  ésta  en  algún  límite  no-relativista. 

El  límite  adecuado  resulta  ser  el  límite  cuando  el  campo  gravitatorio  es  débil  y (casi)  estático, 
es  decir,  cuando  la  curvatura  del  espaciotiempo  es  prácticamente  cero  y todas  las  partículas  (in- 
cluso las  que  causan  el  campo  gravitatorio)  tienen  velocidades  mucho  más  bajas  que  la  velocidad 
de  la  luz,  uCl.  Con  esta  última  condición  estamos  eligiendo  implícitamente  un  sistema  de  coor- 
denadas específico,  el  sistema  donde  todas  las  velocidades  son  pequeñas.  Aunque  de  este  modo 
estamos  perdiendo  covariancia  general,  no  nos  importa  demasiado  de  momento,  ya  que  la  teoría 
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newtoniana  presupone  un  sistema  de  coordenadas  preferido  (un  espacio  y un  tiempo  absoluto).1 

La  condición  del  campo  gravitatorio  débil  permite  escribir  la  métrica  como  una  perturbación 
del  espacio  de  Minkowski 

(10.1) 

con  e <C  1 el  parámetro  de  expansión.  Tomando  en  cuenta  que  hasta  primer  orden  en  e,  la  métrica 
inversa  toma  la  forma 

g ^ w rf"  - sh^,  (10.2) 

en  primera  aproximación  los  símbolos  de  Christoffel  y el  tensor  y el  escalar  de  Ricci  vienen  dados 
por  (ejerc) 


pp 

fiiy 


R 


-srr 


p>- 


d¡ih\v  + dvh  ¡l\  d\hfj 


d2hltv,  R « ^sd2h, 


(10.3) 


donde  h = es  la  traza  de  la  perturbación  de  la  métrica,  0¿  = ri1'1'  O^d,,  es  el  d'alambertiano 

en  el  espacio  de  Minkowski  y donde  hemos  fijado  los  grados  de  libertad  no-físicos  de  h M¡,  a través 
de  la  elección  de  gauge 


-d„h  = 0. 


(10.4) 


En  primera  aproximación,  las  ecuaciones  de  Einstein  para  un  campo  gravitatorio  débil  se  con- 
vierten entonces  en 


1 

2e 


& hf_u/  2 


d2h 


—kT. 


fiiy 


(10.5) 


También  resultará  útil  la  versión  de  esta  ecuación  sin  traza,  es  decir,  la  aproximación  para  campo 
débil  de  (9.22), 


1 

2 


ed2hllv 


Tu 


(10.6) 


donde  T = r)^vT^v.  Obsérvese  que  la  ecuación  de  Einstein  (10.6)  toma  la  forma  de  una  ecuación 
de  ondas  inhomegénea  para  h¡íu.  Discutiremos  esta  propiedad  en  más  detalle  en  en  Capítulo  ??. 


La  segunda  condición,  que  todas  las  velocidades  consideradas  sean  no-relativistas,  implica 
que  podemos  utilizar  el  mismo  parámetro  de  expansión  e para  el  movimiento  de  las  partículas, 
ya  que  v ~ e <C  1.  En  particular,  el  tiempo  propio  (5.25)  de  una  partícula  moviéndose  en  un 
campo  gravitatorio  es  por  lo  tanto  en  primera  aproximación  igual  al  tiempo  en  el  sistema  de 
referencia: 

dr  w dt.  (10.7) 


Una  partícula  que  se  mueve  con  velocidad  v ~ £ viaja  una  distancia  dxl  en  el  intervalo  de  tiempo 
dt  de  modo  que 

dxi  ~ edt,  (10.8) 

y por  lo  tanto  para  cualquier  función  f[x'.  t)  vemos  que 


dtf  ~ edif. 


(10.9) 


En  otras  palabras,  la  derivada  de  una  función  con  respecto  al  tiempo  es  un  orden  en  e mayor  que 
el  gradiente  y pueden  ser  despreciada  en  comparación  con  éstas. 

Con  estas  aproximaciones,  no  sólo  podemos  ver  que  las  ecuaciones  de  Einstein  se  reducen 
a la  ecuación  de  movimiento  de  una  partícula  en  un  potencial  gravitatorio,  sino  que  también 

'Aquí  vemos  que  en  realidad  el  tiempo  absoluto  de  Newton  no  es  más  que  la  coordenada  temporal  del  sistema  de 
referencia  donde  todas  las  partículas  se  mueven  a velocidades  no  relativistas  y el  espacio  absoluto  a las  superficies  t 
constantes  en  estas  coordenadas. 
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podemos  afirmar  que  la  constante  de  proporcionalidad  k en  (9.20)  realmente  es  n = HttGm,  como 
dijimos  en  la  sección  9.2. 


El  potencial  newtoniano  se  saca  de  la  ecuación  de  la  geodésica  (7.36),  la  ecuación  de  movi- 
miento de  una  partícula  libre  en  relatividad  general.  Las  componentes  espaciales  se  reducen  en 
nuestra  aproximación  a 


d2xl  dxi  dxk 

~dF  + " + lk~dFltt 


(10.10) 


donde  hemos  utilizado  la  aproximación  (10.7).  El  último  término  se  puede  despreciar  frente  a los 
primeros  dos,  ya  que  también  es  de  orden  e1 , debido  a (10.8).  Por  último  tenemos  que  en  primera 
aproximación 


Y1 

1 tt 


2£r]ZJ 


Zdtht.j  djhtt 


-erf^jhtt 


-2 &gtt , 


(10.11) 


donde  en  la  segunda  igualdad  hemos  despreciado  las  derivadas  temporales  frente  al  gradiente 
por  (10.9)  y en  la  tercera  igualdad  hemos  utilizado  la  expansión  (10.1)  para  escribir  el  resultado 
en  término  de  la  métrica  gliv.  La  ecuación  de  la  geodésica  se  reduce  por  lo  tanto  a 

(P  \ 

■W  * 2^-  (1CU2) 

Comparando  esta  expresión  con  la  segunda  ley  de  Newton  para  una  partícula  en  un  campo 
gravitatorio  (5.57)  y tomando  en  cuenta  que  dl  = —(V)*,  vemos  que  podemos  identificar  en 
primera  aproximación  el  potencial  de  Newton  $ con  la  componente  <jtt  de  la  métrica:2 


9tt  « 1 + 2$. 


(10.13) 


Efectivamente,  en  el  Capítulo  11  veremos  que  la  solución  de  las  ecuaciones  de  Einstein  que  des- 
cribe un  objeto  masivo  estático  con  masa  m y con  simetría  esférica  viene  dada  por  la  métrica  de 
Schwarzschild, 

ds2  = ^ _ 2 ^ ^ _ 2 G^m^ ^ ^ + ^ ^ (iai4) 


donde  C'  v es  la  constante  de  Newton,  de  modo  que  con  (10.13)  recuperamos  la  forma  conocida 
del  potencial  newtoniano  para  objectos  esféricos 


$ 


Gntti 

r 


(10.15) 


Efectivamente,  con  la  identificación  del  potencial  newtoniano  (10.15),  la  ecuación  de  la  geodési- 
ca (10.12)  se  convierte  en  la  conocida  segunda  ley  de  Newton  para  una  partícula  en  un  potencial 
gravitatorio:  x = — V$.  Obsérvese  que  aquí  vemos  concretamente  lo  que  ya  habíamos  dicho  en  el 
Capítulo  8:  lo  que  para  Newton  es  una  fuerza  gravitatoria  Fg  que  actúa  a distancia,  es  para  Eins- 
tein un  término  geométrico,  la  componente  1’^  de  la  conexión  de  Levi-Civita  del  espaciotiempo 
en  que  se  mueve  la  partícula. 

El  valor  de  la  constante  de  proporcionalidad  n lo  obtenemos  a través  de  las  ecuaciones  de 
Einstein  (10.6)  para  un  campo  débil,  originado  por  una  distribución  de  materia  fría  (polvo)  con 
velocidades  no  relativistas.  En  esta  aproximación  la  única  componente  no  cero  del  tensor  de 
energía-momento  (9.1)  es  r¡'f  t w po,  de  modo  que  bajando  los  índices  y tomando  la  traza  tenemos 
que 

Tu  ~ Po,  T « po-  (10.16) 

2Nótese  que  asumimos  que  el  espaciotiempo  sea  asintóticamente  plano  (para  la  definición  véase  Capitulo  11).  Si  el 
espaciotiempo  no  es  asintóticamente  plano,  la  definición  del  potencial  gravitatorio  es  un  poco  más  complicada. 
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La  componente  (tt)  de  la  ecuación  de  Einstein  (10.6)  es  por  lo  tanto 

eAhtt  « npo,  (10.17) 

donde  hemos  despreciado  las  derivadas  temporales  d2  frente  al  laplaciano  A = (),[)’.  De  (10.1)  y 
(10.13)  sabemos  que  en  primera  aproximación  podemos  identificar  ehu  con  dos  veces  el  potencial 
gravita  torio,  de  modo  que  (10.17)  se  convierte  en 

A$  « i kPo.  (10.18) 

Una  comparación  con  la  ecuación  de  Poisson  (5.58)  fija  la  constante  de  proporcionalidad  de  (9.20) 

en  k — 87 rGjv- 

En  resumen,  tanto  la  Segunda  Ley  de  Newton  (5.57)  como  la  ecuación  de  Poisson  (5.58)  están 
contenidas  dentro  de  la  relatividad  general,  en  el  límite  donde  el  campo  gravitatorio  es  débil 
y todas  las  velocidades  consideradas  son  mucho  más  bajas  que  la  velocidad  de  la  luz,  es  decir, 
cuando  tanto  los  efectos  de  la  curvatura  del  espacio  como  los  efectos  de  la  relatividad  especial 
son  despreciables.  Este  es  efectivamente  el  rango  de  validez  que  uno  esperaría  para  la  mecánica 
y la  gravedad  newtoniana. 


10.2.  El  perihelio  de  Mercurio 

Einstein  propuso  tres  tests  para  comprobar  su  relatividad  general:  el  avance  del  perihelio  de 
Mercurio,  la  deflexión  de  la  luz  por  un  objeto  masivo  y la  dilatación  gravitacional  del  tiempo, 
conocidos  hoy  como  los  tres  tests  clásicos.  Estos  tests  son  más  fáciles  en  la  presencia  de  un  obje- 
to masivo  estático  con  simetría  esférica.  Como  ya  hemos  mencionado  en  la  sección  anterior,  la 
métrica  que  describe  un  espaciotiempo  de  tal  objeto  es  la  métrica  de  Schwarzschild, 

ds2  = (i  - dt2  - (i  - — ) ~Xdr2  - r2 (d02  + sin2  9dP2) , (10.19) 

donde  la  constante  M = G\rm,  con  dimensiones  de  longitud,  es  una  medida  para  la  masa  m 
del  objeto.  Para  el  Sol,  M corresponde  aproximadamente  a 1,5  km  (para  más  detalles  sobre  la 
derivación  de  esta  métrica  y su  significado  físico  referimos  al  Capítulo  11). 

El  test  del  avance  del  perihelio  de  Mercurio  consiste  en  que  la  relatividad  general  predice  una 
corrección  relativista  a la  primera  ley  de  Kepler  en  las  órbitas  de  los  planetas:  en  lugar  de  que  el 
planeta  siga  órbitas  perfectamente  elípticas  (en  ausencia  de  otros  planetas),  la  trayectoria  tiene 
en  primera  aproximación  la  forma  de  un  elipse  que  gira  lentamente  en  el  plano  de  la  órbita,  de 
modo  que  el  perihelio,  la  posición  más  cercana  al  Sol,  se  mueve  cierto  ángulo  27re  a lo  largo  de 
un  círculo  con  respecto  a su  perihelio  anterior  (véase  Figura  10.1) 

Para  entender  bien  el  argumento  relativista,  es  conveniente  repasar  brevemente  el  cálculo 
newtoniano.  Es  interesante  observar  que  ambos  cálculos  llegan  a las  mismas  ecuaciones  (salvo 
correcciones  relativistas)  por  argumentos  totalmente  distintos. 

En  el  formalismo  newtoniano,  la  manera  más  fácil  de  calcular  las  órbitas  de  las  planetas  es  a 
partir  de  la  ley  de  conservación  de  momento  angular  L y la  ley  de  conservación  de  energía  E para 
una  partícula  con  masa  mo  (con  mo  -C  M/Gn)  en  un  potencial  newtoniano  V (r)  = —m^M/r, 

m0r2<p  = L,  -mo(r2  + r2p2)  — m°^  = E,  (10.20) 

2 r 

donde  hemos  asumido,  sin  pérdida  de  generalidad,  que  la  partícula  se  mueve  en  el  plano  ecua- 
torial 9 = 7t/2.  Sustituyendo  ¡p¿  en  la  ley  de  conservación  de  energía  por  su  valor  en  función  de 
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Figura  10.1:  El  avance  del  perihelio  (exagerado):  Cada  vuelta  alrededor  del  Sol,  el  perihelio  se  mueve  con 
un  ángulo  2tte 


L y cambiando  a la  variable  u 


= r 1 , la  ley  de  conservación  de  energía  se  convierte  en  (ejerc.) 

( du\2  n 2moE  2mZM 

W)  +*=  — + TT“'  (m21) 


donde  hemos  escrito  la  variable  u como  función  de  y:  a través  de  la  regla  de  la  cadena 

du  du  dtp 
dt  dp  dt 


(10.22) 


La  ecuación  (10.20)  se  puede  integrar  directamente,  pero  es  más  fácil  si  la  derivamos  otra  vez  con 
respecto  a ¡p,  para  obtener  la  ecuación  de  Binet  (ejerc.) 


moM 

~L ~ 


(10.23) 


cuya  solución  son  las  conocidas  secciones  cónicas 

m0M  / \ 

u = — 2 (^1  + e costpj, 


(10.24) 


donde  e = \J\  + 2L2 E / m^M  es  la  excentricidad  de  la  órbita.  Para  energía  E < 0,1a  excentricidad 
e es  menor  que  1 y la  trayectoria  es  un  elipse. 

Miramos  ahora  el  caso  relativista.  Para  calcular  la  órbita  de  una  partícula  con  masa  rao  en 
relatividad  general  tenemos  que  calcular  las  geodésicas  temporales  en  la  solución  de  Schwarz- 
schild  (10.19).  Las  componentes  t y p de  la  ecuación  de  la  geodésica  (7.39)  y la  condición  (7.46) 
de  que  sea  temporal  en  este  espacio  vienen  dadas  por 


/ 2 M\ 

1 t = k, 

9 L 

i1-—) 

r ip  = , 

ra0 

t 2 M\ 

1 í2  - (l 

2M\-1  „ 9 9 

i1-—) 

\ ‘2  2 • 2 i 

r - r tp  = 1, 

r / 

(10.25) 

donde  k y L son  constantes  de  integración.  Por  comparación  con  (10.20)  podemos  interpretar  L 
como  el  momento  angular  de  la  partícula,  mientras  k es  la  constante  de  proporcionalidad  en- 
tre la  coordenada  temporal  t y el  tiempo  propio  de  la  partícula.  Sustituyendo  las  primeras  dos 
ecuaciones  en  la  última  obtenemos  (ejerc.) 

( dr\ 2 2/  2 M\ 

fe)  +rfe— ) 


1 + 


mñr 


L2 


K m^r 

Td~ 


= 0, 


(10.26) 
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y cambiando  a la  variable  u = 1/r,  la  ecuación  se  reduce  a (ejerc.) 


f du\2  o ?rin(fc2  — 1) 

fe)  +U  =^1^- 


2??t.q  M 
L2 


w + 2 Mu3, 


(10.27) 


La  ecuación  (10.27)  es  muy  parecida  a la  ley  de  conservación  de  energía  (10.21)  en  el  caso  new- 
toniano,  salvo  el  último  término.  Esto  implica  que  podemos  interpretar  k como  una  medida  para 
la  energía  de  la  partícula, 

E = i, n0(k 2 - 1),  (10.28) 

mientras  que  el  último  término,  2 Mu3,  actúa  como  una  perturbación  a la  ecuación  newtoniana. 
Efectivamente,  el  tercer  término  es  mucho  más  pequeño  que  el  segundo  puesto  que 


3 Mu2  _ 3 L2  _ 3M(1  — e2) 
TOqM/L2  a2m  q a 


(10.29) 


donde  a es  el  eje  mayor  del  elipse  y donde  en  la  última  igualdad  hemos  utilizado  la  segunda  y la 
tercera  ley  de  Kepler, 


2txo2\/\  — e2 
L 


rj~i2 


27 r2a3 
M 


(10.30) 


Dado  que  para  el  Sol  M es  aproximadamente  1,5  km  y para  Mercurio  a = 6 • 106  km  y e = 0, 2056, 
vemos  que,  para  el  caso  de  Mercurio,  el  término  relativista  en  (10.27)  es  del  orden  de  10~ ' veces 
menor  que  el  segundo  término.  Obsérvese  que  para  los  demás  planetas,  el  eje  mayor  es  aún  más 
grande  y la  excentricidad  es  más  pequeña  (salvo  para  Plutón),  de  modo  que  la  perturbación  es 
aún  menor. 


En  lugar  de  intentar  resolver  la  ecuación  (10.27),  resulta  más  fácil  derivarla  con  respecto  a <p  y 
obtener  la  llamada  ecuación  relativista  de  Binet  (ejerc.) 


TOqM 


+ 3 Mu2, 


(10.31) 


donde  otra  vez  el  último  término  es  una  pertubación  a la  ecuación  de  Binet  (10.23).  Definiendo  el 
parámetro  de  perturbación  adimensional 


3wgM2  3 M 

L 2 “ a(\  — e2)  ’ 


(10.32) 


cuyo  valor  para  Mercurio  es  del  orden  de  10  1 , y suponiendo  que  la  solución  es  en  primera 
aproximación  de  la  forma  u = u0  + eu\,  con  Uq  la  solución  newtoniana  (10.24),  encontramos  que 
la  ecuación  para  la  perturbación  en  primer  orden  viene  dada  por  (ejerc.) 


[(‘  + 7) 


+ 2ecos  <p  + -e2cos2  <p 


d2ui  rrinM  r 

Sustituyendo  el  Ansatz 

ui  = A + Bip  eos  + C eos  2p 

en  la  ecuación  (10.33),  encontramos  que  existe  una  solución  para  (ejerc.) 


A = 


m^M 


(1  + 7)' 


B = 


rn^Me 
~E2~ ’ 


_ m^Me2 
O — — 


6 L2 


de  modo  que  la  solución  hasta  primer  orden  viene  dada  por  (ejerc.) 


nigM 


^1  + e costpj  + e- 


m%M  r 


L 2 


1 + e<p  sin  <p  + e' 


'(3 


— - eos  2 ip 
6 


(10.33) 

(10.34) 


(10.35) 


(10.36) 
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De  los  términos  de  corrección,  el  segundo  es  el  más  importante  porque  es  proporcional  a ip  y 
representa  por  lo  tanto  un  efecto  acumulativo.  Despreciando  los  otros  términos  y quedándonos 
sólo  con  términos  hasta  orden  e,  podemos  escribir  (10.36)  como  (ejerc.) 


u 


WqM 

~L ~ 


1 + e eos 


1 — e 


(10.37) 


Esta  ecuación  es  muy  parecida  a la  del  elipse  (10.24),  sólo  que  hay  una  perturbación  de  orden  e 
en  la  dependencia  angular.  Por  lo  tanto,  la  curva  (10.37)  representa  en  primera  aproximación  un 
elipse,  pero  el  periodo  de  la  trayectoria  no  es  de  27t,  sino  un  poco  mayor, 

« 2tt(1+£).  (10.38) 


En  otras  palabras,  el  planeta  no  sigue  una  trayectoria  perfectamente  elíptica,  sino  que  el  elipse  se 
va  girando  un  poco  cada  revolución,  de  modo  que  el  planeta  alcanza  su  perihelio  un  poquito  más 
tarde  cada  vez.  El  retraso  viene  dado  precisamente  por  el  parámetro  e.  La  definición  (10.32)  de  e 
nos  enseña  que  el  efecto  es  independiente  de  la  masa  mo  del  planeta,  pero  que  aumenta  cuanto 
más  cerca  esté  el  planeta  del  Sol  y más  excéntrica  sea  su  órbita. 

El  desplazamiento  del  perihelio  de  Mercurio  de  574  arcosegundos  por  siglo  ya  era  conocida 
desde  la  primera  mitad  del  siglo  XIX.  En  los  1850,  Le  Verrier,  el  co-descubridor  de  Neptuno,  cal- 
culó que  la  mayor  parte  del  efecto  medido  (531  arcosegundos  por  siglo)  es  debido  a la  influencia 
gravitational  de  los  demás  planetas,  sobre  todo  de  Venus.  Pero  el  cálculo  de  Le  Verrier  también 
mostró  que  aún  quedaba  un  desplazamiento  adicional  de  unos  42  arcosegundos  por  siglo  sin  ex- 
plicar, mucho  más  que  el  error  observacional,  lo  que  hizo  que  el  problema  era  considerado  como 
una  de  las  anomalías  más  grandes  de  la  mecánica  newtoniana.  Le  Verrier  mismo  creó  que  este 
efecto  era  debido  a la  existencia  de  un  planeta  interior  a Mercurio,  bautizado  Vulcano.3  El  proble- 
ma de  esta  teoría  era  que  para  poder  causar  el  efecto  calculado,  Vulcano  debería  ser  tan  grande 
que  sería  perfectamente  visible  desde  la  Tierra.  A pesar  de  que  se  anuciaron  algunas  observa- 
ciones (después  de  la  publicación  de  Le  Verrier),  su  existencia  nunca  se  ha  llegado  a confirmar 
y el  problema  permaneció  hasta  que  Einstein  calculó  en  1915  las  correcciones  relativistas  al  po- 
tencial newtoniano  y vió  que  causaban  un  desplazamiento  al  perihelio  de  Mercurio  adicional 
al  efecto  newtoniano,  que  cuadraba  con  las  observaciones.  Efectivamente  el  efecto  relativista  es 
de  42, 98  ± 0, 04  arcosegundos  por  siglo,  con  un  error  teórico  perfectamente  compatible  con  las 
observaciones. 


10.3.  La  deflexión  de  la  luz 


El  cálculo  de  la  deflexión  de  la  luz  es  muy  parecido  al  cálculo  del  perihelio  de  Mecurio,  sólo 
que,  en  vez  de  calcular  las  geodésicas  temporales  en  la  solución  de  Schwarzschild,  hay  que  cal- 
cular las  geodésicas  nulas.  Por  lo  tanto,  restringiéndonos  al  movimiento  plano,  las  componentes 
t y 6 de  la  ecuación  de  la  geodésica  y la  condición  de  que  éste  sea  nula  imponen  las  siguientes 
ecuaciones,  análogas  a (10.25), 


(‘ 


= 0, 


(10.39) 


donde  ahora  el  punto  indica  una  derivación  con  respecto  al  parámetro  a de  la  geodésica  nula,  que 
ya  no  tiene  la  interpretación  del  tiempo  propio  y í es  el  momento  angular  asociado  a la  geodésica. 

3No  confundir  con  el  planeta  paterno  de  Mr.  Spock  en  Star  Trek.  Aunque  sí  hay  relación:  cuando  Gene  Roddenberry 
(1921  - 1991)  inventó  Star  Trek  en  1964,  recicló  el  nombre  del  planeta  de  Le  Verrier  para  los  primeros  extraterrestres  que 
aparecen  en  su  serie. 
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Figura  10.2:  La  ecuación  de  la  recta  en  R2  en  coordenadas  polares  (r,  ip):  las  constantes  de  integración  R0 
y po  representan  respectivamente  la  distancia  de  la  recta  hasta  el  origen  y el  ángulo  con  respecto  al  eje  x. 


Con  una  derivación  idéntica  al  caso  de  las  geodésicas  temporales,  obtenemos  el  análogo  de  la 
ecuación  (10.27)  (donde  otra  vez  u = 1/r), 

(|D  +u2  = ^ + 2Mu' J>  (10-40) 

y derivando  con  respecto  a <p  la  ecuación  relativista  de  Binet  para  geodésicas  nulas, 

d2u 

— + u = 3 Mu2.  (10.41) 

dip¿ 

Obsérvese  que  tanto  el  momento  angular  i como  la  medida  para  la  energía  k han  desaparecido 
de  la  ecuación.  Al  tratarse  de  partículas  sin  masa,  que  se  mueven  siempre  con  la  velocidad  de  la 
luz,  estas  cantidades  están  en  realidad  determinadas  por  la  distancia  r al  centro  de  gravedad. 

Hay  un  límite  en  que  esta  ecuación  es  fácil  de  resolver  de  manera  exacta:  cuando  M = 0,  la 
solución  de  Schwarzschild  (10.19)  se  reduce  al  espacio  de  Minkowski  in  coordenadas  esféricas  y 
en  esta  caso  la  solución  de  (10.41)  viene  dada  por 

u{ip)  = Rq 1 sin(<p  - <p0).  (10.42) 

En  la  expresión  en  términos  de  r, 

r sin(<p  — ipo)  = Rq,  (10.43) 

reconocemos  la  ecuación  de  la  recta  en  R2  en  coordenadas  polares,  donde  f?0  representa  la  dis- 
tancia de  la  recta  hasta  el  origen  y ipo  el  ángulo  con  respecto  al  eje  x (véase  Figura  10.2),  lo  que 
efectivamente  es  el  resultado  esperado  para  una  geodésica  nula  en  el  espacio  de  Minkowski. 


Igual  que  para  el  perihelio  de  Mercurio,  intentaremos  resolver  la  ecuación  de  Binet  (10.41)  en 
el  límite  donde  el  término  a la  derecha  es  una  perturbación  del  resultado  newtoniano,  sólo  que 
ahora  nuestro  parámetro  adimensional  viene  dado  por 


£ = 


3 M 
Ro 


(10.44) 


Exigir  por  lo  tanto  que  e <C  1 es  considerar  sólo  geodésicas  cuya  distancia  Ro  hasta  el  centro 
del  potencial  gravitatorio  sea  mucho  más  grande  que  M,  es  decir,  geodésicas  que  pasan  lejos  del 
objeto  en  el  centro.4  En  este  caso  la  ecuación  de  Binet  (10.41)  se  puede  escribir  como 

d2v 

—r  + u = eR0u2,  (10.45) 

dtp¿ 


4Como  comparación:  en  el  Capítulo  11  veremos  que  el  horizonte  del  agujero  negro  neutro  y estático  está  localizado  en 
el  radio  de  Schwarzschild  r = 2 M. 
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Figura  10.3:  La  deflexión  de  la  luz:  la  luz  de  un  objeto  (estrella  negra)  que  pasa  cerca  de  un  objeto  masivo, 
está  desviada  por  el  campo  gravitatorio  y proyecta  una  imagen  (estrella  blanca)  en  una  posición  distinta. 


y asumiendo  que  la  solución  u(y)  es  una  perturbación  del  resultado  newtoniano 

u(<p)  = uo(y)  + £Ui(ip),  (10.46) 


con  uo(ip)  dado  por  (10.42),  se  puede  ver  fácilmente  que  la  ecuación  para  m es  de  la  forma 

7 2 

+ ui  = Rjj1  sin2  (ip-  ¥>o),  (10.47) 

cuya  solución  viene  dada,  hasta  primer  orden  en  e,  por 


3^0  + fPRo  cos(ip  — yo)  + -ñ0  eos  (y -y o), 


(10.48) 


con  ¡3  una  constante  adimensional  arbitraria,  que  podemos  poner  a cero  para  el  caso  que  nos 
interesa.  La  solución  completa,  hasta  primer  orden  en  e,  es  por  lo  tanto 


o,  en  términos  de  r. 


u{tp)  « ñ0  1 sin(y  - y0)  + ^ 1 + cos2(y-y0) 

U0  L 


M r 


(10.49) 


r sin(y  — yo)  « ñ0  - — 1 + cos2(y-y0) 
ito  L 


(10.50) 

donde  efectivamente  se  puede  ver  el  término  entre  corchetes  como  una  perturbación  de  (10.43). 


Lejos  del  centro  del  objeto  masivo  (es  decir  para  r yy-  M),  la  solución  tiende  asintóticamente 
al  espacio  de  Minkowski,  de  modo  que  para  r — > oo,  la  trayectoria  de  la  luz  tiende  a una  recta. 
Sólo  cerca  del  objeto  masivo,  la  desviación  es  apreciable  y la  trayectoria  real  interpola  entre  una 
recta  entrante  y otra  saliente.  Consecuentemente,  el  ángulo  ó de  la  deflexión  de  la  luz  es  el  ángulo 
entre  estas  dos  rectas,  que  viene  dado  por  la  suma  de  los  ángulos  ipi  y y 2 que  hacen  las  rectas  con 
el  eje  x (véase  Figura  10.3).  Para  determinar  S en  términos  de  M y R0,  basta  con  expresar  yi  y y 2 
en  función  de  éstas,  a través  de  (10.50). 


Cuando  u — > 0,  y — > a lo  largo  de  la  recta  saliente,  de  modo  que  (10.49)  se  reduce  a 


0 


_i  x M r 2, 

R0  sin  (y  — y2)  + [1  + eos  (y-y2) 


(10.51) 


o,  en  hasta  primer  orden  en  y — y2/ 


2 M 
ñ0 


(10.52) 
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Figura  10.4:  Una  lente gravitatoria:  un  objeto  lejano  (estrella  negra)  proyecta  múltiples  imágenes  (estrellas 
blancas)  en  el  cielo  terrestre,  debido  que  un  objeto  masivo  más  cercano  enfoca  la  luz  emitida  en  direcciones 
diferentes. 


Por  otro  lado  a lo  largo  de  la  recta  entrante  — > ip\  + tt  asintóticamente,  de  modo  que  (10.50) 

impone  la  condición 

2 M 

y>2  « -<p  + — , (10.53) 

río 

donde  el  signo  viene  del  hecho  de  que  sin(<pi  + n)  = — sin  ip\. 

El  ángulo  de  la  deflexión  de  la  luz  es  por  lo  tanto 


5 = Ifl  + (fi2 


4 M 
Ro 


(10.54) 


El  efecto  de  la  deflexión  de  la  luz  hace  que  la  trayectoria  de  la  luz  que  ha  pasado  cerca  del  centro 
de  la  solución  de  Schwarzschild  se  desvia  y proyecta  una  imagen  en  una  parte  del  cielo  distinta 
a su  verdadera  posición  (Véase  Figura  10.3).  Concretamente  para  el  Sol  (para  el  cual,  como  ya 
hemos  dicho  M ss  1,5  km),  el  ángulo  de  deflexión  de  una  estrella  es  de  unos  1,7  segundos  de 
arco,  si  la  luz  pasa  justo  fuera  del  radio  del  Sol.  En  circunstancias  normales  esto  no  se  notaría,  ya 
que  la  propia  luz  del  Sol  taparía  la  de  la  estrella,  pero  el  efecto  sí  podría  manifestarse  durante  los 
eclipses  solares. 

En  1919,  dos  expediciones  inglesas  intentaron  medir  el  efecto  en  el  eclipse  solar  del  29  de  mayo 
de  ese  año  en  Brasil  y en  la  isla  de  Príncipe,  delante  de  la  costa  de  África  occidental,  ésta  última 
liderada  por  el  renombrado  astrofísico  británico  Arthur  Eddington  (1881  - 1944).  Debido  a las 
dificultades  técnicas  inherentes  a un  experimento  de  tal  calibre  (en  realidad  demasiadas  para  en 
la  época),  la  calidad  de  los  resultados  era  muy  pobre,  con  poca  precisión  y pocos  datos  para  hacer 
una  buena  estadística  de  error.  Aún  así  el  equipo  en  Principe  medio  una  deflexión  entre  1,31  y 
1,91  segundo  de  arco  y el  equipo  en  Brasil  una  media  de  1,91  segundo  de  arco  con  un  aparato  y de 
0,86  con  otro,  un  resultado  que  parece  confirmar  cualitativamente  las  prediciones  de  relatividad 
general,  aunque  claramente  no  cuantitativamente  (¡siendo  la  predicción  newtoniana  0,8!).  Incluso 
hay  constancia  de  que  Eddington,  un  gran  admirador  de  Einstein  y de  la  relatividad  general,  fue 
un  tanto  selectivo  con  el  análisis  de  los  datos  y los  métodos  estadísticos  empleados.  Pero  más 
por  el  peso  de  la  autoridad  de  Eddington  que  por  los  argumentos  científicos,  los  resultados  de 
las  expediciones  de  1919  fueron  recibidos  como  la  gran  confirmación  de  la  relatividad  general  y 
dió  Einstein  su  estatus  de  prototipo  de  científico  famoso. 

Sin  embargo,  hoy  en  día  ya  nadie  duda  de  que  la  deflexión  de  la  luz  sea  un  efecto  real,  gracias 
a la  cosmología  observacional.  El  efecto  de  la  deflexión  de  la  luz  no  es  típico  de  la  solución  de 
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Schwarzschild  (sólo  es  más  fácil  calcularlo  aquí,  debido  a la  simetría  de  la  solución),  sino  que  ocu- 
rre en  general  cerca  de  cualquier  conjunto  grande  de  masa  y energía.  Hay  numerosos  ejemplos 
de  galaxias  y cuásares  que  están  en  posiciones  (ligeramente)  distintas  en  el  cielo,  pero  muestran 
exactamente  el  mismo  espectro,  indicando  que  en  realidad  se  trata  del  mismo  objeto.  La  luz  de 
estos  objetos  lejanos,  inicialmente  emitida  en  direcciones  (ligeramente)  distintas,  está  enfocada 
al  pasar  cerca  de  otro  objeto  muy  masivo  más  cercano.  En  este  caso  el  objecto  cercano  realmente 
actúa  como  una  lente  gravitacional,  proyectando  múltiples  imágenes  en  el  cielo  terrestre  (véase 
Figura  10.4).  Este  efecto  ocurre  en  tres  dimensiones,  por  lo  que  puede  dar  lugar  a configuracio- 
nes como  la  Cruz  de  Emstein  (el  cuásar  QS02237  + 0305,  que  proyecta  5 imágenes  en  forma  de 
cruz)  o (secciones  de)  los  anillos  de  Einstein  que  aparecen  en  las  fotografías  de  campo  profundo, 
hechas  por  el  Hubble  Space  Telescope.  La  distorsión  de  los  objetos  en  estas  imágenes  nos  puede 
dar  información  sobre  la  cantidad  y la  distribución  de  la  materia  oscura  en  el  universo. 

El  mismo  efecto  (aunque  aún  no  observado)  ocurre  cerca  de  agujeros  negros:  el  campo  gra- 
vitatorio  de  estos  objetos  es  tan  grande  que  la  luz  puede  dar  completamente  la  vuelta  o incluso 
llegar  a orbitar  el  agujero  negro.  Los  efectos  de  distorsión  gravitacional  de  las  imágenes  son  ma- 
yores cuanto  más  uno  se  acerca  (y  no  suele  ser  considerada  en  imágenes  artísticas  de  agujeros 
negros,  por  lo  que  éstas  son  poco  fiables). 


10.4.  El  efecto  Doppler  gravitacional 

En  la  sección  8.4  ya  habíamos  deducido  la  existencia  de  un  efecto  Doppler  gravitacional  a base 
del  Principio  de  Equivalencia  e incluso  habíamos  derivado  unos  primeros  resultado  cualitativos 
para  un  campo  gravitatorio  constante  a través  de  un  ascensor  acelerado.  En  esta  sección  quere- 
mos hacer  la  derivación  con  más  cuidado  con  las  herramientas  de  relatividad  general  y geometría 
diferencial.  Sin  embargo,  el  estudiante  atento  notará  un  paralelismo  entre  esta  derivación  y la  de 
la  sección  8.4. 

El  efecto  Doppler  gravitacional  no  sólo  ocurre  para  campos  gravitacionales  constantes,  sino 
para  cualquier  espaciotiempo  estático.  En  grandes  líneas,  un  espaciotiempo  estático  quiere  decir 
que  existe  un  sistema  de  coordenadas  donde  podemos  dividir  las  cuatro  coordenadas  en  una 
temporal,  digamos  t,  y tres  espaciales  x'  y que  las  componentes  de  la  métrica  y;,„  no  dependen 
de  la  coordenada  temporal  t.  Además  la  simetría  t — > — t de  las  soluciones  estáticas  impide  que  la 
métrica  tenga  términos  cruzados  gu,  de  modo  que  la  forma  más  general  de  una  métrica  estática 
viene  dada  por 

ds 2 = gtt(xk)dt2  — gij(xk)  dxl  dxC  (10.55) 

Consideremos  ahora  dos  observadores,  llamados  el  emisor  y el  detector,  en  reposo  en  dos 
posiciones  diferentes  del  espaciotiempo,  ambos  equipados  con  un  reloj  atómico.  Sean  = x*¿  (re ) 
y x¿  = xl¡  (t,i  ) las  lineas  de  universo  de  cada  observador,  parametrizados  por  el  tiempo  propio 
de  cada  uno.  El  emisor  emite  con  cierte  regularidad  señales  hacia  el  detector,  donde  el  intervalo 
dre  entre  dos  emisiones  viene  dado  por 

dr 2 = g^{xe)dx^  dxv  = gtt{xe)dt2.  (10.56) 

Por  otro  lado,  el  intervalo  entre  dos  detecciones  drd  no  necesariamente  tiene  que  coincidir  con 
dre,  de  modo  que 

dr2d  = (7  dre)2  = gtt{xd)  dt2 , (10.57) 

donde  7 es  el  factor  de  dilatación  temporal  debido  al  campo  gravitatorio  y podemos  obtener  una 
expresión  para  7 dividiendo  ambas  expresiones. 


7 = 


lgtt(xd ) 
gtt(xe)  ' 


(10.58) 
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En  otras  palabras,  si  el  periodo  de  entre  la  emisión  de  dos  señales  consecutivas  es  Te,  entonces  el 
periodo  entre  dos  detecciones  consecutivas  es 


o,  en  términos  de  frecuencias. 


Td  = Te 


lgtt(xd) 

9tt(Xe ) ’ 


Vd  = Ve 


IgttjXe) 

9ti(xd)' 


(10.59) 


(10.60) 


Por  lo  tanto,  si  gtt(xe)  < 9tt{xe)>  tenemos  que  vd  < ve.  En  otras  palabras,  un  rayo  de  luz  per- 
derá energía  al  intentar  salir  del  pozo  potencial  gravitatorio  y sufrirá  un  corrimiento  hacia  el 
rojo.  Nótese,  sin  embargo,  que  no  hemos  particularizado  a ninguna  solución  específica,  de  modo 
que  el  efecto  es  no  sólo  válido  para  la  solución  de  Schwarzschild  (10.19),  sino  en  general  para 
cualquier  solución  estática. 


La  fórmula  (10.59)  es  una  generalización  de  la  derivación  de  la  sección  8.4,  hecha  a base  del 
Principio  de  Equivalencia.  De  la  sección  10.1  sabemos  que  en  espaciotiempos  estáticos  el  poten- 
cial newtoniano  $ está  relacionado  con  la  componentes  gtt  de  la  métrica  a través  de  (10.13),  de 
modo  que  podemos  aproximar  (10.59)  por 


Td 


Te 


l + 2$(xd) 
1 + 2$(;re) 


Te 


1 + $(xd)  - <¡>(xe)  , 


(10.61) 


donde  en  la  última  igualdad  hemos  expandido  la  raíz  cuadrada  en  un  desarrollo  de  Taylor  hasta 
primer  orden  en  $,  con  lo  que  recuperamos  la  formula  (8.19). 

En  1960  los  físicos  americanos  Robert  Pound  (1919  - 2010)  y Glen  Rebka  (1931  - ) comprobaron 
experimentalmente  el  efecto  en  el  Jefferson  Laboratory  de  la  Universidad  de  Harvard.  La  idea 
central  del  experimento  está  basada  en  la  emisión  y absorción  de  fotones  cuando  un  átomo  pasa 
de  un  estado  excitado  a su  estado  base  y vice  versa.  Dado  que  la  energía  de  la  luz  emitida  por  los 
átomos  exitados  al  decaer  al  estado  cambia  al  viajar  por  el  campo  gravitacional  de  la  Tierra,  los 
fotones  ya  no  pueden  excitar  los  átomos  similares  en  el  detector.  Para  poder  cuantificar  el  efecto, 
Pound  y Rebka  hicieron  mover  la  fuente  con  una  velocidad  v con  respecto  al  detector  para  causar 
un  adicional  efecto  Doppler  (cinemático) 


vd  = veJ^-—^-,  (10.62) 

V 1 + v 

que  compensaría  el  efecto  Doppler  gravitacional.  Sólo  con  una  velocidad  v específica,  los  dos 
efectos  se  contrarrestarían  completamente,  maximizando  la  probabilidad  de  absorción  de  los  fo- 
tones. En  particular,  para  el  experimento  de  Pound  y Rebka,  había  buscar  v tal  que  (suponiendo 
que  el  campo  gravitatorio  de  la  Tierra  viene  descrita  por  la  métrica  de  Schwarzschild) 


1 — v 


1 - 


2 M 

Ro~\~h 


1 - 


2 M 
Ro 


i, 


(10.63) 


donde  Rq  es  el  radio  de  la  Tierra  y h la  altura  de  la  torre  del  Jefferson  Laboratory,  que  medía  22,5  m 
de  altura.  El  cambio  de  energía  en  la  onda  electromagnética  debido  a esta  diferencia  de  potencial 
gravitatoria  es  del  orden  de  SE/E  « 2, 5- 10” 15 , lo  que  les  obligó  a usar  rayos  gamma  de  14  keV  y 
aprovechar  el  recién  descubierto  efecto  Mósbauer  (1958)  para  absorber  el  retroceso  del  núcleo  del 
átomo  al  emitir  un  fotón  tan  energético.  Los  resultados  originales  de  Pound  y Rebka  confirmaron 
las  predicciones  de  la  relatividad  general  con  una  exactitud  de  un  10  %,  mejorándolos  unos  años 
más  tarde  al  1 %.  Los  experimentos  actuales  miden  una  precisión  de  un  0, 01  %. 
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Otro  experimento  que  confirmó  la  dilatación  temporal  gravitacional  fue  el  Gravity  Probe  A, 
un  satélite  lanzado  en  1976  vérticulamente  hasta  una  altura  de  10.000  km,  donde  según  las  pre- 
dicciones teóricas  un  reloj  debería  correr  4, 5 • 10-8  % más  rápido  que  en  la  superficie  de  la  Tierra. 
Equipado  con  un  máser  de  hidrógeno  de  alta  precisión  y comparándolo  con  otro  máser  en  la  su- 
perficie, Gravity  Probe  A era  capaz  de  medir  que  la  variación  en  el  ritmo  de  los  relojes  concordaba 
con  las  predicciones  teóricas  con  una  precisión  de  7 • 10-5  %. 

Pero  quizá  la  aplicación  más  famosa  del  efecto  Doppler  gravitacional  se  encuentra  en  el  siste- 
ma de  GPS  (Global  Positioning  System).  Para  determinar  su  posición  sobre  la  superficie  terrestre, 
el  aparato  GPS  tiene  que  contactar  mediante  señales  electromagnéticas  con  por  lo  menos  4 de  los 
24  satélites  que  formas  la  red  GPS,  que  orbitan  a Tierra  a una  altura  de  20.000  km.  Comparando 
los  tiempos  recibidos  de  los  diferentes  satélites  y triangulando  los  resultados,  un  aparato  GPS 
(civil)  es  capaz  de  conseguir  una  precisión  de  menos  de  10  m en  cuestión  de  segundos.  Para  obte- 
ner la  precisión  deseada,  los  satélites  están  equipados  con  unos  relojes  atómicos  que  emiten  con 
una  frecuencia  de  1, 023  • 10 6Hz  para  uso  civil  y 10,  23  • 10 6Hz,  donde  el  error  en  cada  emisión  no 
puede  superar  los  30  ns  (30  • 10_9s) . 

Sin  embargo,  al  estar  en  órbita  a 20.000  km  de  altura,  hay  que  tomar  en  cuenta  dos  efectos 
relativistas:  el  primero  es  el  efecto  de  la  dilatación  temporal  cinemática  de  relatividad  especial, 
debido  a su  velocidad  (orbital)  con  respecto  al  aparato  GPS  en  la  superficie  terrestre,  que  hace  que 
los  relojes  atómicos  se  atrasan  con  respecto  a la  Tierra.  Por  otro  lado  está  el  efecto  de  relatividad 
general,  debido  a la  diferencia  de  potencial  gravitatoria  que  hace  que  los  relojos  atómicos  corren 
más  de  prisa  arriba  que  abajo.  Los  dos  efectos  se  contrarrestan  y el  resultado  final  depende  de  la 
altura  de  los  satélites.  Cuanto  menor  la  altura  h sobre  la  superficie  terreste,  más  alta  es  la  veloci- 
dad orbital  y más  pequeña  la  diferencia  en  potencial  gravitatoria,  de  modo  que  más  dominará  el 
efecto  de  relatividad  especial.  Dos  dos  efectos  se  cancelan  cuando  h = \Rq,  en  caso  de  la  Tierra 
a una  altura  de  3200  km,  pero  a los  20.000  km  de  altura  donde  están  colocados  los  satélites  GPS, 
el  efecto  dominante  es  el  de  relatividad  general.  Concretamente,  su  velocidad  orbital  de  14.000 
km/ h hace  retrasar  los  relojos  7 // .s  al  día,  pero  la  diferencia  de  altura  los  adelanta  con  45  ¡is  al 
día,  resultando  en  un  efecto  de  38  ps  al  día,  tres  órdenes  de  magnitud  más  que  el  error  permitido 
(30  ns)  para  alcanzar  la  precisión  exigida. 

Al  diseñar  el  sistema  GPS,  los  ingenieros  han  tenido  que  tomar  en  cuenta  este  efecto,  entre 
otras  cosas  instalando  relojes  atómicos  con  una  frecuencia  ligeramente  más  pequeña  (en  la  Tie- 
rra), de  modo  que  en  órbita  tendría  exactamente  la  frecuencia  deseada.  Al  no  tomar  en  cuenta 
el  efecto  Doppler  gravitacional,  el  sistema  GPS  tendría  un  error  acumulativo  (!)  de  unos  10  km . 
al  día,  volviendo  el  sistema  GPS  completamente  inútil  en  cuestión  de  horas.  El  efecto  Doppler 
gravitacional  en  el  sistema  GPS  es  probablemente  el  único  efecto  de  relatividad  general  que  se 
manifiesta  en  la  vida  cotidiana. 


10.5.  El  efecto  Shapiro 

A los  tres  testsc  lásicos  de  relatividad  general,  propuestos  por  Einstein,  se  suele  añadir  un 
cuarto,  el  efecto  del  retraso  temporal  gravitacional,  o el  efecto  Shapiro,  propuesto  por  el  astrofísico 
americano  Irwin  Shapiro  (1929  - ) en  1964.  La  idea  consiste  en  mandar  una  señal  de  radar  a un 
planeta  cercano,  digamos  Venus,  cuando  éste  está  (casi)  alineado  con  la  Tierra  y el  Sol,  midiendo 
cuánto  tarde  la  señal  en  reflectar  en  la  superficie  y ser  detectada  otra  vez  en  la  Tierra.  La  rela- 
tividad general  predice  que  al  viajar  por  el  espaciotiempo  curvado  por  el  Sol,  la  trayectoria  de 
la  señal  es  más  larga  y el  tiempo  necesario  para  recorrerla  mayor  que  si  el  espacio  fuera  plano 
(véase  Figura  10.5). 

Al  igual  que  en  el  caso  de  la  deflexión  de  la  luz,  tenemos  que  tratar  con  geodésicas  nulas  en  la 
solución  de  Schwarzschild,  cuya  aproximación  hasta  primer  orden  en  M /R0  ya  hemos  calculado 
en  (10.50).  Sin  embargo,  como  ya  consideramos  el  espaciotiempo  hasta  orden  M/r,  podemos 
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Figura  10.5:  El  efecto  Shapiro:  Un  rayo  de  luz  (linea  continua)  emitida  desde  la  Tierra  (T)  refleja  en  la 
superficie  de  Venus  (V)  y está  detectado  otra  vez  en  la  Tierra.  Al  viajar  por  el  campo  gravitatorio  del  Sol 
(S),  la  trayectoria  por  el  espaciotiempo  curvo  es  más  larga  y la  señal  sufrirá  un  retraso  en  comparación  con 
el  espacio  plano. 


aproximar  las  geodésicas  por  la  expresión  (10.43)  a orden  cero.  La  condición  de  que  la  geodésica 
sea  nula  viene  dada  por 


(i 


df1  - r2dyf  = 0, 


(10.64) 


donde  podemos  eliminar  dp2  a través  de  la  expresión  de  la  geodésica  no  perturbada.  Diferen- 
ciando (10.43)  obtenemos  que 

sin  p dr  + rcospdp  = 0,  (10.65) 


o,  equivalentemente,  usando  la  misma  expresión  (10.43)  (ejerc.), 

2 i 2 

r dtp  = 


d2 

0 dr2 , 


r2  — Rf 


(10.66) 


con  Rq  la  distancia  mínima  a la  que  se  acerca  la  señal  del  origen.  Sustituyendo  esto  en  (10.64), 
tenemos  que  (ejerc.) 


dt2 


Rp 

r2  - R2 


dr2 


r2-Rñ 


4 M 


2 MRl 


dr 2 


(10.67) 


donde  en  la  segunda  ecuación  nos  hemos  quedado  con  los  términos  de  primer  orden  del  desa- 
rrollo de  Taylor  en  M/r.  Sacando  la  raíz  cuadrada  de  esta  expresión,  otra  vez  hasta  primer  orden 
en  M /r. 


dt 


± r 

I 


2 M 
r 


MR2 


dr. 


(10.68) 


podemos  obtener  una  expresión  para  dt  en  función  de  r,  cuya  integral  corresponde  al  tiempo  que 
tarda  la  señal,  integrando  esta  última  expresión  entre  la  posición  de  ambos  planetas.  Obsérvese 
que  el  signo  menos  corresponde  a la  parte  de  la  trayectoria  entre  la  posición  Rt  de  la  Tierra  y R0 
y el  signo  positivo  con  la  parte  entre  la  posición  liy  de  Venus  y Rq.  El  tiempo  total  para  la  señal 
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para  llegar  a Venus  es  por  lo  tanto 
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(10.69) 


Los  primeros  dos  términos  representan  la  distancia  entre  la  Tierra  y Venus  si  el  espaciotiem- 
po  fuera  plano,  y los  términos  proporcionales  a M son  las  correcciones  relativistas  debidas  a la 
métrica  de  Schwarzschild  . 

El  efecto  Shapiro  para  los  planetas  internos  (Mecurio,  Venus  y Marte)  es  del  orden  de  200 
/j,s  y fue  confirmado  por  Shapiro  mismo  en  1967  con  una  precisión  de  un  3 % y de  un  1 % en 
experimentos  posteriores.  Sin  embargo  la  era  de  los  viajes  interplanetarios  ha  permitido  obtener 
resultados  muchos  mejores,  midiendo  el  retraso  en  señales  en  la  comunicación  con  naves  espa- 
ciales como  los  Mariner  6 y 7 cerca  del  Sol  y el  Viking  en  Marte  con  una  precisión  de  0, 1 % y en 
el  2003  una  precisión  de  0, 0012  % con  el  Cassini,  orbitando  Saturno. 


10.6.  Tests  modernos  de  la  relatividad  general 

Aparte  de  los  tests  clásicos  y sus  variantes  modernos,  hay  varios  otras  pruebas  a las  que  se  ha 
sometido  la  relatividad  general  en  las  últimas  décadas. 

Entre  2004  y 2005  el  satélite  Gravity  Probe  B,  orbitando  la  Tierra,  ha  estado  recogiendo  da- 
tos para  comprobar  dos  predicciones  de  la  relatividad  general,  hasta  entonces  no  comprobadas: 
el  efecto  geodético  y el  efecto  de  Lense-Thirring.  El  efecto  geodético,  también  llamado  el  efecto  De 
Sitter,  fue  derivado  en  1916  por  el  físico  y astrónomo  holandés  Willem  De  Sitter  (1872  - 1934) 
al  estudiar  correcciones  relativistas  al  movimiento  del  sistema  Tierra-Luna.  El  efecto  geodético 
predice  la  precesión  del  momento  angular  de  una  masa  de  prueba  en  órbita  alrededor  de  una 
masa  central,  como  en  la  solución  de  Schwarzschild  (10.14),  debido  al  transporte  paralelo  de  es- 
te vector  por  el  espacio  curvo.  Por  otro  lado,  el  efecto  Lense-Thirring,  descubierto  por  los  físicos 
austríacos  Josef  Lense  (1890  - 1985)  y Hans  Thirring  (1888  - 1976)  en  1918,  predice  una  precesión 
adicional  (ortogonal  al  efecto  geodético,  pero  más  pequeño)  del  momento  angular  de  la  masa  de 
prueba,  si  el  objeto  central  está  rotando  (por  ejemplo  la  solución  de  Kerr,  discutida  en  el  Capítulo 
??).  El  efecto  Lense-Thirring  está  íntimamente  ligado  con  el  efecto  de  arrastre  de  sistemas  inercia- 
les  (discutido  en  detalle  en  la  sección  ??),  que  afirma  que  un  objeto  masivo  en  rotación  arrastra 
consigo  el  espaciotiempo  en  su  alrededor,  como  una  bola  rotando  en  un  fluido  viscoso. 

El  experimento  de  Gravity  Probe  B consistía  de  cuatro  giróscopos  superconductores,  mante- 
nidos constantemente  a una  temperatura  menor  de  2 K por  helio  superfluido  para  minimizar  las 
interferencias  y orientados  a IM  Pegasi,  una  estrella  de  referencia  a 329  años-luz  en  la  constela- 
ción de  Pegaso.  La  precisión  de  estos  giróscopos  era  tal  que  eran  capaces  de  medir  variaciones 
en  la  orientación  del  eje  de  rotación  menores  que  0,5  miliarcosegundos  por  año  (al  ángulo  bajo  el 
que  se  vería  el  grosor  de  un  pelo  humano  desde  32  km  de  distancia!). 

Las  predicciones  teóricas  para  una  masa  de  prueba  orbitando  la  Tierra  son  de  —6606,1  mi- 
liarcosegundos por  año  para  el  efecto  geodético  y de  —39,2  milisegundos  de  arco  por  año  para 
el  efecto  Lense-Thirring.  Los  resultados  experimentales  fueron  respectivamente  de  —6601,8  ± 
18,3  y —37,2  ± 7,2  milisegundos  de  arco  por  año,  una  confirmación  del  efecto  geodético  con  una 
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precisión  del  0, 5 %.  La  precisión  en  la  medición  del  efecto  Lense-Thirring  es  bastante  más  baja, 
debido  al  hecho  de  que  la  magnitud  del  efecto  era  de  la  mismo  orden  que  ruido  que  no  se  había 
tomado  en  cuenta  al  modelar  el  experimento.  Varios  años  de  análisis  y extracción  de  datos  aún 
han  permitido  alcanzar  una  precisión  de  un  19  %. 

Todos  los  tests  de  la  relatividad  general  que  hemos  discutido  hasta  ahora  han  sido  tests  he- 
chos dentro  del  sistema  solar  y por  lo  tanto,  por  muy  exitosos  que  hayan  sido,  sólo  han  podido 
comprobar  el  régimen  de  campo  débil  de  la  teoría,  es  decir,  donde  las  correcciones  a la  teoría 
newtoniana  son  pequeñas.  Mucho  más  difícil,  pero  por  lo  menos  igual  de  importante  es  compro- 
bar la  teoría  en  situaciones  donde  el  campo  gravitatorio  es  muy  fuerte.  Para  eso  el  estudio  de  los 
púlsares  binarios  es  idoneo. 

Un  púlsar  binario  es  un  púlsar5  que  forma  parte  de  un  sistema  estelar  binario,  junto  con 
una  enana  blanca,  una  estrella  de  neutrones  y ocasionalmente  incluso  otro  púlsar.  En  general 
una  estrella  de  neutrones  por  si  sola  ya  produce  un  campo  gravitatorio  muy  fuerte,  puesto  que 
contiene  aproximadamente  una  masa  solar  comprimida  en  un  radio  de  unos  diez  kilómetros. 
Pero  si  además  un  objeto  de  estas  dimensiones  está  orbitando  junto  con  otro  acompañante  masivo 
vertiginosamente  su  centro  de  masa  común  a una  distancia  del  orden  de  distancia  Tierra-Luna, 
la  relatividad  general  predice  que  este  sistema  es  una  fuente  constante  de  ondas  gravitacionales. 
Estas  ondas  gravitacionales  no  son  detectables  directamente  (aún),  pero  sí  se  puede  comprobar  su 
existencia  en  las  variaciones  de  la  órbita  del  pulsar:  las  ondas  gravitacionales  se  llevan  una  parte 
de  la  energía  potencial  y cinética  del  sistema,  disminuyendo  el  periodo  de  órbita  y haciendo  que 
las  masas  se  acercan  lentamente  hasta  chocarse. 

En  1974  los  astrónomos  americanos  Russell  A.  Hulse  (1950  - ) y Joseph  Taylor  (1941  - ) des- 
cubieron  el  primer  púlsar  binario,  PSR  B1913+16,  a 21.000  años-luz  en  la  constelación  del  Águila. 
El  sistema  consiste  de  un  púlsar  y una  estrella  de  neutrones,  ambos  con  una  masa  de  aproxima- 
damente 1,4  masas  solares,  a una  distancia  que  varía  entre  750.000  y 3.000.000  km,  unos  pocos 
radios  solares.  Las  dos  estrellas  tienen  un  periodo  orbital  de  poco  menos  de  8 horas.  Desde  su 
descubrimiento,  hace  más  de  35  años,  Hulse  y Taylor  han  seguido  observando  PSR  B1913+16, 
encontrando  que  el  periodo  orbital  ha  bajado  unos  76,5  //  .s  por  año,  y el  semi-eje  mayor  ha  di- 
minuido 3,5  m por  año.  Estos  resultados  confirman  las  predicciones  teóricas  hasta  un  0,  2 %.  En 
1993  se  les  otorgó  a Hulse  y Taylor  el  Premio  Nobel  de  Física  por  sus  resultados. 

En  2003,  la  radioestronoma  italiana  Marta  Burgay  (1976  - ) descubrió  un  púlsar  doble,  PSR 
J0737-3039,  un  sistema  binario  formado  por  dos  púlsares  con  masas  alrededor  de  1,3  masas  sola- 
res y un  periodo  orbital  de  sólo  2,4  horas.  La  importancia  de  PSR  J0737-3039  es  el  púlsar  binario 
con  el  periodo  más  corto  conocido,  lo  que  permite  hacer  pruebas  de  efectos  relativistas  con  muy 
alta  precisión.  También  aquí  se  mide  un  pérdida  de  energía  en  forma  de  ondas  gravitacionales, 
resultando  en  que  la  órbita  disminuye  con  7 mm  al  día,  confirmando  también  las  predicciones 
teóricas  con  alta  precisión. 

Más  general,  la  relatividad  general  predice  la  existencia  de  agujeros  negros,  ondas  gravitacio- 
nales y un  universo  dinámico,  cuyas  propiedades  discutiremos  en  detalle  en  la  Parte  ??.  Aunque 
los  primeros  dos  no  han  sido  detectados  directamente,  sí  hay  indicaciones  indirectas  muy  fuertes 
de  su  existencia.  Para  el  caso  de  las  ondas  gravitacionales,  ya  hemos  mencionado  la  pérdida  de 
energía  en  forma  de  radiación  gravitatoria  en  los  sistemas  de  púlsares  binarios.  Y para  el  caso  de 
los  agujeros  negros,  se  han  observado  los  efectos  sobre  la  materia  cercana  de  campos  gravitatorios 
tan  fuertes,  que  ningún  modelo  astrofísico  permite  que  sea  causado  por  otra  cosa  que  agujeros 
negros.  Quiza  el  ejemplo  más  convincente  es  Sagitario  A*,  una  fuente  de  radioondas  localizada 

5 Los  púlsares  son  estrellas  de  neutrones  que  emiten  pulsos  de  radiación  electromagnética  muy  regulares  en  la  direc- 
ción de  la  Tierra.  Las  estrellas  de  neutrones,  los  restos  de  una  estrella  que  han  sobrevivido  una  explosión  de  supenova, 
son  objetos  tremendamente  compactos  y tienen  campos  magnéticos  muy  fuertes,  que  hace  que  emiten  radiación  elec- 
tromagnética fuerte  a lo  largo  del  eje  magnético.  Si  el  eje  magnético  no  está  alineado  con  el  eje  de  rotación,  el  haz  de 
radiación  gira  como  un  faro  por  el  espacio.  Si  este  haz  pasa  por  la  Tierra,  se  observa  la  estrella  de  neutrones  como  un 
púlsar.  El  periodo  de  pulsaciones  es  muy  estable  y varía  de  púlsar  a púlsar  entre  segundos  y milisegundos. 
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en  el  centro  de  nuestra  galaxia.  Monitorizaciones  de  los  movimientos  de  las  estrellas  cercanas  han 
revelado  que  en  la  vecindad  de  Sagitario  A*  hay  una  concentración  de  unos  4 millones  de  masas 
solares  en  un  radio  de  menos  de  44  millones  de  kilómetros  (menos  que  el  radio  de  la  órbita  del 
planeta  Mercurio),  lo  que  sólo  se  puede  interpretar  como  un  agujero  negro  supermasivo.  Aún  así, 
las  indicaciones  de  la  existencia  de  estos  fenómenos  es  solamente  indirecta.  La  detección  directa 
de  sobre  todo  ondas  gravitacionales  sería  no  sólo  una  confirmación  importante  de  la  relatividad 
general,  sino  también  abriría  una  nueva  ventana  para  entender  la  dinámica  de  la  gravedad  y la 
estructura  del  universo. 

Por  otro  lado  sí  tenemos  confirmaciones  más  directas  de  las  implicaciones  cosmológicas  de 
las  ecuaciones  de  Einstein,  aunque  aquí  las  predicciones  no  sólo  van  por  cuenta  de  la  relatividad 
general,  sino  también  de  la  física  de  partículas.  Las  ecuaciones  de  Einstein  permiten  un  amplio 
espectro  de  soluciones  cosmológicas,  sin  precisar  cuál  de  ellas  realmente  corresponde  con  nuestro 
universo,  pero  el  paradigma  cosmológico  sugerido  por  la  teoría,  en  combinación  con  las  actua- 
les conocimientos  de  física  de  partículas,  ha  permitido  a lo  largo  de  la  segunda  mitad  del  Siglo 
XX  reproducir  con  bastante  precisión  ciertas  observaciones  cosmológicas,  como  la  abundancia  de 
hidrógeno  y helio  en  el  universo  y la  temperatura  del  fondo  cósmico  de  microondas.  Pero  gra- 
cias a las  observaciones  precisas  desde  los  años  1990,  se  han  podido  determinar  los  parámetros 
cosmológicos  con  tanta  precisión  que  ya  podemos  hablar  de  un  Modelo  Estándar  Cosmológico, 
en  analogía  con  el  Modelo  Estándar  de  la  física  de  partículas. 

Pero  también  es  verdad  que  es  en  la  cosmología  donde  quedan  más  preguntas  abiertas.  Una 
de  las  cosas  que  hemos  aprendido  recientemente  es  que  la  materia  observada  directamente  (es 
decir  en  forma  de  estrellas,  planetas,  etc)  sólo  contribuye  un  4,  6 % del  contenido  total  de  energía 
en  el  universo.  Las  observaciones  de  la  distribución  de  materia  en  galaxias  y cúmulos  de  gala- 
xias relevan  que  hay  5 veces  más  masa  de  la  que  vemos  ópticamente.  Hay  fuertes  indicaciones 
de  que  esta  materia  oscura,  que  sólo  podemos  observar  a través  de  sus  efectos  gravitatorios,  no 
es  bariónica  (es  decir,  no  está  hecha  de  protones  y neutrones,  como  la  materia  que  conocemos). 
Pero  incluso  el  conjunto  de  materia  sólo  forma  una  fracción  del  contenido  total  de  energía  del 
universo:  más  preciso  un  27, 6 % (4, 6 % visible  y 23  % materia  oscura).  Los  restante  71  % aparecen 
en  una  forma  desconocida,  denominada  energía  oscura  y es  la  responsable  de  la  observada  expan- 
sión acelerada  del  universo.  Las  observaciones  cosmológicas  sugieren  que  esa  energía  oscura  se 
comporta  muy  parecido  a una  constante  cosmológica,  aunque  es  demasiado  pronto  para  excluir 
del  todo  otras  posibilidades.  En  otras  palabras,  ¡menos  del  5 % del  contenido  del  universo  viene 
en  forma  conocida,  mientras  el  95  % es  de  un  tipo  que  nunca  ha  sido  detectado  en  un  laboratorio! 

Se  suele  interpretar  la  materia  oscura  como  lagunas  en  los  actuales  modelos  de  física  de 
partículas  y se  espera  que  por  ejemplo  la  supersimetría  pueda  proporcionar  candidatos  para  la 
materia  oscura  (aunque  hay  también  intentos  de  modificar  las  ecuaciones  de  Einstein,  generando 
un  comportamiento  distinto  de  la  gravedad  a escalas  cósmicas,  que  explicaría  los  efectos  obser- 
vados sin  tener  que  recurrir  a la  materia  de  un  tipo  desconocido).  Por  otro  lado,  el  problema  de 
la  energía  oscura  es  de  otro  tipo,  ya  que  en  este  caso  ni  siquiera  sabemos  de  qué  forma  de  energía 
estamos  hablando. 

Si  la  energía  oscura  realmente  resultara  ser  una  constante  cosmológica  A (de  todas  las  po- 
sibilidades, la  más  familiar),  seguiría  la  pregunta  de  qué  representa  esta  A.  La  teoría  cuántica 
de  campos  predice  una  energía  del  vacío  en  forma  de  la  energía  del  punto  cero  de  los  campos 
cuánticos,  que  resultaría  en  una  constante  cosmológica  efectiva.  Sin  embargo  esta  constante  cos- 
mológica sería  120  (!)  órdenes  de  magnitud  mayor  que  la  energía  oscura  de  nuestro  universo.  La 
pregunta  por  lo  tanto  no  es  sólo  qué  representa  la  energía  oscura  observada,  sino  también  por 
qué  la  energía  del  vacio  es  tan  baja  en  comparación  con  las  predicciones  de  la  teoría  cuántica  de 
campos. 

En  realidad  nos  encontramos  aquí  en  el  umbral  de  un  terreno  completamente  desconocido: 
la  gravedad  cuántica.  Toda  la  relatividad  general  (y  la  gran  mayoría  de  la  física  explicada  en 
este  curso)  es  puramente  clásica  y no  toma  en  cuenta  el  carácter  cuántico  de  la  Naturaleza.  Hay 
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resultados  importantes  en  el  régimen  semi-clásico,  como  la  teoría  cuántica  de  campos  en  espacios 
curvos,  que  trata  el  contenido  de  energía  y materia  como  cuántico,  pero  la  gravedad  misma  como 
clásica,  por  ejemplo  en  la  cercancía  de  agujeros  negros.  Pero  no  tenemos  una  una  descripción 
intrínsicamente  cuántica  de  la  interacción  gravitatoria,  en  parte  porque  el  régimen  donde  estos 
efectos  cuánticos  son  importantes  están  completamente  fuera  de  alcance  de  nuestra  tecnología 
experimental  actual:  se  supone  que  la  interacción  gravitatoria  entre  dos  protones  es  del  mismo 
orden  que  la  electromagnética  a la  escala  de  Planck,6 * 

~ 1019  GeV,  (10.70) 

(en  unidades  con  c = 1,  sino  tendríamos  que  rrip  = \J¡ic/G unos  15  órdenes  de  magnitud 
más  que  las  energías  producidas  en  el  LHC.  Aunque  hay  algunos  candidatos,  como  la  teoría  de 
cuerdas  y gravedad  cuántica  de  bucles  (loop  quantum  gravity),  los  intentos  de  construir  estas 
teorías  son  puramente  teóricos,  basados  principalmente  en  elegancia  y consistencia  matemática. 
Por  eso,  la  física  cerca  de  agujeros  negros  y la  constante  cosmológica  pueden  ser  unas  de  las  pocas 
pistas  que  tenemos  para  echar  algo  de  luz  sobre  este  campo. 


61  GeV  = 109  eV . Un  electronvoltio  (1  eV)  es  la  energía  que  adquiere  un  electrón  cuando  pasa  por  la  diferencia  de 

potencial  de  un  voltio.  Un  electronvoltio  con  aproximadamente  1,  6 ■ 10-19  J. 
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Parte  IV 

Soluciones  de  las  Ecuaciones  de 

Einstein 
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Capítulo  11 

La  solución  de  Schwarzschild 


No  esperaba  que  se  pudiera  obtener  una  solución  exacta  de  manera  tan  sencilla. 
(A.  Einstein,  en  una  carta  a K.  Schwarzschild) 


Ya  hemos  dicho  en  varias  ocasiones  que  las  ecuaciones  de  Einstein  son  muy  difíciles  de  re- 
solver, debido  a su  carácter  no  lineal,  de  modo  que  la  superposición  de  dos  soluciones  no  es  una 
nueva  solución.  No  es  difícil  entender  la  razón  física  para  esta  no  linealidad:  sabemos  que  el  espa- 
cio se  curva  debido  a su  contenido  de  masa  y energía.  Pero  la  propia  curvatura  del  espaciotiempo 
contiene  energía,  de  modo  que  la  misma  curvatura  es  una  fuente  de  curvatura.  En  otras  palabras, 
la  gravedad  no  sólo  se  acopla  a la  energía  y la  materia,  sino  también  a sí  misma,  lo  que  resulta  en 
ecuaciones  no  lineales. 

Einstein  mismo  creyó  inicialmente  que  sus  ecuaciones  eran  tan  complicadas  que  nunca  se 
encontraría  una  solución  exacta.  Sin  embargo,  pocos  meses  después  de  la  publicación  de  la  rela- 
tividad general,  en  1916,  Karl  Schwarzschild  (1873  - 1916)  halló  la  solución  exacta  de  un  objeto 
estático  con  simetría  esférica  y en  los  últimos  90  años  decenas,  si  no  cientos  de  soluciones  exactas 
han  sido  encontradas.  En  este  capítulo  discutiremos  esta  solución  de  Schwarzschild  y su  signifi- 
cado físico. 


11.1.  La  derivación  de  la  solución  de  Schwarzschild 


La  solución  de  Schwarzschild  es  una  solución  estática  de  las  ecuaciones  del  vacío,  con  si- 
metría esférica.  Por  lo  tanto  es  una  buena  descripción  para  el  campo  gravitatorio  causado  por 
objetos  masivos  esféricos,  como  estrellas  y planetas.  En  particular,  son  precisamente  las  geodési- 
cas de  la  métrica  de  Schwarzschild  que  nos  permite  calcular  correcciones  relativistas  a las  órbitas 
planetarias  y la  deflexión  de  la  luz,  como  hemos  visto  en  el  Capítulo  10. 

En  ausencia  de  energía  y materia,  el  tensor  de  energía-momento  7),,,  es  cero  y (la  parte  sin 
traza  de)  las  ecuaciones  de  Einstein  se  reducen  a 

1 V = 0-  (n.i) 

A primera  vista  puede  resultar  extraño  que  las  ecuaciones  del  vacío  admiten  soluciones  no- 
triviales,  aparte  del  espacio  de  Minkowski.  Pero  justo  gracias  a la  no  linealidad  existe  una  gran 
clase  de  soluciones  no-triviales  del  vacío.  Las  métricas  que  satisfacen  la  ecuaciones  del  vacío 
(11.1)  se  llaman  Ricci-planas.  Las  soluciones  que  son  Ricci-planas  en  general  no  son  planas,  pero 
sí  son  soluciones  del  vacío  (en  ausencia  de  una  constante  cosmológica). 

La  solución  de  Schwarzschild  es  la  solución  no-trivial  más  sencilla,  debido  a su  gran  cantidad 
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de  simetría.  Para  empezar  es  estática,  lo  que  significa  en  grandes  líneas  que  no  hay  evolución  en 
el  tiempo  y por  lo  tanto  existe  un  sistema  de  coordenadas  en  que  la  métrica  es  independiente  de 
la  coordenada  temporal.  Además  no  puede  haber  términos  cruzados  del  tipo  (ju  dtdx1,  ya  que  la 
presencia  de  estos  términos  rompería  la  invariancia  t — > — t de  las  soluciones  estáticas.  Luego,  la 
simetría  esférica  implica  que  el  espacio  tiene  una  simetría  SO( 3),  es  decir,  que  es  invariante  bajo 
rotaciones  ortogonales  en  tres  dimensiones.1  Existen  por  lo  tanto  unas  coordenadas  angulares  6 
y ip  tales  que  las  secciones  espaciales  t = t0  se  puedan  escribir  como 

ds 2 = - f(r)dr 2 - r2(d62  + sin 2é»dp2),  (11.2) 

donde  r es  la  coordenada  radial.  En  principio  el  factor  delante  de  la  parte  angular  puede  ser  una 
función  arbitraria  h2{r),  pero  con  un  cambio  de  coordenadas  r = h(r)  siempre  se  puede  escribir 
la  métrica  en  la  forma  (11.2). 

Sabemos  que  las  ecuaciones  de  Einstein  son  demasiado  difíciles  de  resolver  directamente, 
pero  gracias  a la  simetría  de  la  solución  de  Schwarzschild  podemos  escribir  un  Ansatz  (una  pro- 
puesta) de  la  forma 


ds2  = e2A(r)dí2  - e2B^dr2  - r2  (d92  + sin 2(Mp2), 


(11.3) 


con  A(r)  y B(r)  dos  funciones  que  quedan  por  determinar.  Nótese  cómo  el  Ansatz  refleja  la 
simetría  esférica  y el  hecho  de  que  la  solución  es  estática  en  la  ausencia  de  términos  cruzados  y 
el  hecho  de  que  Ay  B son  funciones  de  r únicamente.  La  idea  ahora  es  sustituir  este  Ansatz  en 
las  ecuaciones  del  vacío  (11.1)  para  determinar  Ay  B. 

No  es  difícil  calcular  los  símbolos  de  Christoffel.  Los  símbolos  no-triviales  vienen  dados  por 
(ejerc.): 

p,  = e2(A-B)  A/}  Te0  = r-í  = cotg  0 , 

sin2  9 e~2B , (11.4) 


= e2(A-s)A', 

F®  — r_1 

|-1 

II 

= A', 

= r~1. 

pr  

1 <P<P  ~ 

= B', 

LSe  = -re~2B, 

re  = 

de  modo  que  las  componentes  del  tensor  y el  escalar  de  Ricci  que  no  son  cero  son  (ejerc.) 


Ru  = -e2(A-B) 


A"  + (A')  - A'B'  + 2r~  A 


R, 


= A"  + (A')2  - A'B'  - 2r~1B' , 


Rgg  = e 


-2  B 


rA'  - rB'  + 1 


- 1, 


R(rnn  — SÍll  0 RqQ¿ 


R = — 2e 


-2  B 


A”  + (A1)2  - A'B'  + 2r~1(A'  -B')  + r 


— l 


2 r 


-i 


(11.5) 


donde  la  prima  denota  la  derivada  con  respecto  a r.  Igualar  todas  las  componentes  del  tensor  de 
Ricci  a cero,  como  exige  las  ecuaciones  de  Einstein,  nos  hace  resolver  un  sistema  de  4 ecuaciones 
diferenciales  no-lineales  acopladas  para  dos  incógnitas.  En  principio  este  sistema  está  sobrede- 
terminado y no  tiene  soluciones,  pero  veremos  que  no  todas  las  ecuaciones  son  independientes. 

Multiplicando  Ru  por  e~2í/'  y sumándolo  con  Rrr  obtenemos  que 

0 = e~2{-A-B)Rtt  + Rrr  = -2r-\A' + B'),  (11.6) 

'Ojo,  esto  no  implica  que  las  secciones  espaciales  sean  R3.  La  solución  de  Schwarzschild  misma  ya  es  un  contraejem- 
plo, como  veremos  en  breve. 
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de  modo  que  B(r)  = — A(r)  + cq.  La  constante  de  integración  ci¡  no  tiene  significado  físico,  ya 
que  se  puede  absorber  en  una  redefinición  de  la  coordenada  temporal  t'  - ec°t.  Sin  pérdida  de 
generalidad  podemos  poner  cq  = 0 y la  solución  general  de  (11.6)  es 

A(r)  = —B(r).  (11.7) 


Sustituyendo  esta  condición  en  la  ecuación  para  Rgg  encontramos 


0 


2 A 


2 rA'  + 1 


- 1 = 


re 


2 A 


- 1. 


Este  ecuación  se  puede  integrar  directamente 


e 


2 A 


2 M 


(11.8) 


(11.9) 


donde  —2 M es  una  constante  de  integración  con  dimensión  de  longitud,  elegida  de  esta  forma 
para  futura  conveniencia. 

Vemos  por  lo  tanto  que  resolviendo  dos  ecuaciones  (la  de  Rgg  y una  combinación  de  Rtt  y Rrr) 
hemos  determinado  las  funciones  A(r)  y B(r)  por  completo,  salvo  una  constante  de  integración. 
Estará  claro  de  (11.5)  que  la  ecuación  para  Rv¡p  está  satisfecha  si  la  de  Rgg  lo  está.  Queda  por  lo 
tanto  sólo  otra  combinación  de  las  ecuaciones  para  Rtt  y Rrr  por  resolver.  Lo  más  sencillo  es  la 
misma  ecuación  para  Rrr.  No  es  difícil  averiguar  que  efectivamente  (11.9)  satisface  idénticamente 
la  ecuación 

A"  + 2(A')2  + 2r"1A'  = 0,  (11.10) 

para  cualquier  valor  de  M. 

La  solución  de  Schwarzschild  viene  por  lo  tanto  dada  por 


ds2 


-1 


dr 2 — r2dtt 2, 


(11.11) 


donde  dfi2  = dd2  + sin2  ddip2  es  el  elemento  de  línea  de  la  dos-esfera  §2. 

Discutamos  ahora  la  interpretación  y algunas  propiedades  físicas  de  la  solución  de  Schwarz- 
schild. Por  razones  que  se  harán  claras  en  breve,  nos  limitaremos  de  momento  a la  región  donde 
r > 2 M.  En  la  sección  10.1  hemos  visto  que  para  soluciones  estáticas  y con  poca  curvatura  la 
componente  gtt  de  la  métrica  es  proporcional  al  potencial  gravitatorio  newtoniano.  Por  lo  tanto 
comparando  (10.13)  y gtt  de  (11.11),  vemos  que  efectivamente  podemos  identificar  el  potencial 
newtoniano  $ = —M/r.  Dado  que  en  la  mecánica  newtoniana  el  potencial  gravitatorio  de  un 
objeto  esférico  con  masa  m viene  dado  por  $ = -G :\rm,/r,  está  claro  que  la  solución  de  Schwarz- 
schild describe  un  objeto  esférico  y estático  en  el  origen  y además  podemos  interpretar  la  cons- 
tante de  integración  M como 

M = GNm.  (11.12) 

En  otra  palabras,  M es  una  medida  para  la  masa  del  objeto  que  causa  la  curvatura  del  espacio.  A 
veces  se  denomina  a M como  la  masa  geométrica  de  la  solución  de  Schwarzschild. 

Aquí  encontramos  un  primer  ejemplo  de  como  las  constantes  de  integración  que  surgen  de 
las  ecuaciones  de  movimiento  distinguen  entre  diferentes  soluciones  con  las  mismas  condiciones 
de  contorno.  La  ecuación  de  Einstein  dice  que  el  contenido  de  energía  y materia  no  determina 
la  geometría  del  espaciotiempo  por  completa,  sino  sólo  la  parte  descrita  por  su  tensor  de  Ricci. 
Por  lo  tanto,  diferentes  métricas,  con  tensores  de  Riemann  distintas,  pero  con  el  mismo  tensor  de 
Ricci,  son  soluciones  a la  ecuación  de  Einstein  con  el  mismo  tensor  de  energía-momento.  Y una 
manera  en  que  se  diferencian  estas  métricas  es  en  el  valor  de  las  constantes  de  integración,  como 
vemos  aquí:  tanto  el  espacio  de  Minkowski,  como  la  solución  de  Schwarzschild  son  soluciones 
de  (11.1),  pero  Schwarzschild  tiene  un  valor  no-trivial  para  la  constante  de  integración  M que 
surge  al  resolver  (11.9),  mientras  Minkowski  se  caracteriza  precisamente  por  tener  M = 0. 
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Llegado  este  punto  es  útil  dedicar  unas  palabras  a cómo  compaginar  el  hecho  de  que  por  un 
lado  la  solución  de  Schwarzschild  es  una  solución  del  vacío,  en  ausencia  de  masas  y energía, 
y por  otra  lado  su  interpretación  es  la  de  un  espaciotiempo  con  una  masa  m en  el  origen.  La 
solución  de  Schwarzschild  (11.11),  por  lo  menos  la  parte  con  r > Rq,  corresponde  a la  parte 
exterior  del  campo  gravitatorio  causado  por  un  objeto  esférico  con  masa  m y radio  Rq  > 2 M y 
por  esto  su  nombre  más  correcto  es  la  solución  exterior  de  Schwarzschild.  Claramente  el  exterior  de 
ese  objeto  masivo  es  vacío  y la  solución  correspondiente  es  una  solución  del  vacío.  Existe  también 
otra  solución  (también  encontrada  por  Karl  Schwarzschild  en  1916)  que  describe  la  parte  interior 
r < Rq  donde  se  encuentra  la  estrella  o el  planeta,  llamada  la  solución  interior  de  Schwarzschild. 
El  tensor  de  energía-momento  de  la  solución  interior  es  un  fluido  perfecto,  mientras  la  solución 
exterior,  como  ya  hemos  visto,  es  una  solución  de  vacío.  Para  el  caso  de  un  planeta  o una  estrella 
con  radio  Rq  > 2 M,  las  dos  soluciones  enlazan  suavemente  en  r = Rq.  En  la  siguiente  sección 
discutiremos  lo  que  pasa  si  el  radio  Rq  del  objeto  en  el  centro  es  menor  que  2 M. 

Otra  propiedad  de  la  solución  de  Schwarzschild  (11.11),  es  que  para  grandes  valores  de  la 
coordenada  radial  r,  el  factor  M/r  <C  1 y la  métrica  se  aproxima  cada  vez  más  a Minkowski  en 
coordenadas  esféricas.  En  realidad,  esto  es  de  esperar  a la  luz  de  la  interpretación  de  la  solución 
como  un  objeto  masivo  en  el  origen.  De  la  ley  de  Newton  sabemos  que  la  fuerza  gravitatoria  de 
un  objeto  masivo  decae  como  1/r2,  es  decir,  a grandes  distancias  la  influencia  de  la  presencia  del 
objeto  es  despreciable  y el  espacio  se  reduce  a Minkowski.  Soluciones  que  tienen  esta  propiedad 
se  llaman  asintóticamente  planas  y se  las  puede  ver  como  objetos  aislados. 

Finalmente,  existe  un  teorema  de  unicidad  para  la  solución  de  Schwarzschild,  llamado  el  teore- 
ma de  Birkhoff.  Este  teorema  dice  que  la  solución  exterior  (11.11)  es  la  única  solución  esféricamente 
simétrica  de  las  ecuaciones  del  vacío.  En  particular,  no  existen  soluciones  de  vacío  con  simetría 
esférica  que  no  sean  estáticas  y si  una  solución  de  esta  clase  es  estática,  es  Schwarzschild.  En 
otras  palabras  una  bola  de  materia  puede  contraerse  o una  estrella  puede  explotar  conservando 
su  simetría  esférica,  la  solución  exterior  siempre  será  la  misma  métrica  estática  (11.11). 

Aunque  la  demostración  del  teorema  no  es  demasiado  difícil,  no  entraremos  en  detalles,  ya 
que  nos  llevaría  fuera  del  alcance  de  estas  notas.  La  demostración  consiste  básicamente  en  de- 
mostrar que  el  Ansatz  más  general  con  simetría  esférica  es  el  Ansatz  (11.3),  sustituyendo  las 
funciones  A(r)  y B(r)  por  A(t.  r)  y B(t , r).  Las  ecuaciones  de  Einstein  en  seguida  restringen  la 
dependencia  de  Ay  B a ser  funciones  únicamente  de  r y el  resto  de  la  demostración  es  la  mis- 
ma que  la  que  hemos  hecho  antes.  El  teorema  de  Birkhoff  es  un  caso  especial  del  teorema  de 
"no-hair"  (no  tiene  pelo)  para  agujeros  negros  en  general,  que  discutiremos  en  más  detalle  en  el 
Capitulo  ??.  Este  teorema  dice  que  cualquier  agujero  negro  clásico  (no  cuántico)  está  caracteriza- 
do por  sólo  tres  cantidades  físicas:  la  masa,  la  carga  eléctrica  y el  momento  angular.  En  el  caso 
de  soluciones  esféricas  del  vacío,  tanto  la  carga  como  el  momento  angular  son  cero  y por  lo  tanto 
sólo  el  valor  de  M caracteriza  la  solución. 


11.2.  Estructura  causal  de  la  solución  de  Schwarzschild 

Miramos  ahora  a la  solución  (11.11)  entera,  incluido  la  parte  de  r < 2 M para  estudiar  las 
singularidades.  No  es  difícil  ver  que  el  elemento  de  linea  (11.11) 

ds2  = (i  _ ™yt 2 _ (i  _ 1 dr2  - r2(dd 2 + sin 20dip2),  (11.13) 

es  degenerado  o divergente  para  varios  valores  de  las  coordenadas.  Un  primer  ejemplo  es  cuando 
0 = 0 y 0 = 7T,  porque  entonces  gv(p  = 0.  Sin  embargo,  esta  degeneración  es  obviamente  un  arte- 
facto del  uso  de  las  coordenadas  esféricas.  Cualquier  rotación  S'0(3)  movería  esta  singularidad  a 
otro  sitio  que  antes  era  perfectamente  regular  y dejaría  regular  a los  puntos  conflictivos  iniciales. 
Es  más,  un  cambio  a coordenadas  cartesianas  desharía  por  completo  esta  singularidad.  La  apa- 
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rente  singularidad  en  O = O,  n no  es  por  lo  tanto  más  que  una  singularidad  de  coordenadas,  que 
no  nos  preocupará  más. 

Otras  singularidades  son  r = 0 y r = 2 M donde  (ju  es  respectivamente  singular  y cero  (y  grr 
justo  al  revés),  aunque  aquí  no  está  tan  claro  si  son  otra  vez  singularidades  de  coordenadas  o si 
son  físicas.  Ya  hemos  dicho  en  la  sección  9.4  que  la  manera  de  distinguir  singularidades  físicas 
de  singularidades  de  coordenadas  es  mirando  los  invariantes  de  curvatura.  Para  nuestro  caso  de 
la  solución  de  Schwarzschild  (11.13),  tanto  R como  R.1"'  son  de  poca  utilidad,  ya  que  ambos 
son  idénticamente  cero  por  construcción,  debido  al  hecho  de  que  la  solución  de  Schwarzschild 
es  Ricci-plana.  Sin  embargo,  calculando  el  llamado  invariante  de  Kretschmann  R^uP\R^pX,  obte- 
nemos para  la  métrica  (11.13)  que 


48  A/f^ 

RPvP\RíivpX  = (11.14) 

es  decir,  el  invariante  de  curvatura  diverge  para  r — » 0,  pero  queda  perfectamente  regular  para 
r = 2 M.  El  punto  r = 0 representa  por  lo  tanto  una  singularidad  física,  mientras  r = 2 M resulta 
ser  una  singularidad  de  coordenadas.2 

Sin  embargo,  en  contraste  con  la  singularidad  de  coordenadas  en  6 = 0 y 9 = n,  la  singula- 
ridad de  coordenadas  en  r = 2 M sí  tiene  un  significado  físico.  El  radio  r = 2 M se  llama  el  radio 
de  Schwarzschild  y juega  un  papel  importante  en  la  física  de  la  solución  (11.13).  Ahora,  el  hecho 
de  que  las  llamadas  coordenadas  de  Schwarzschild  ( t , r,  9,  <p)  sean  singulares  en  r = 2 M,  hace  que 
estas  no  sean  válidas  en  el  radio  de  Schwarzschild.  Veremos  que  son  las  coordenadas  adecua- 
das para  describir  la  región  donde  r > 2 M,  pero  para  r < 2 M son  poco  fiables  y para  r = 2 M 
completamente  inútiles. 

Una  de  las  maneras  de  ver  que  algo  físicamente  no-trivial  pasa  en  el  radio  de  Schwarzschild 
es  mirando  el  efecto  Doppler  gravitatorio.  En  la  sección  10.4  hemos  visto  que  el  corrimiento 
hacia  el  rojo  de  una  señal  emitida  desde  un  punto  con  coordenada  re  y medida  en  un  punto  con 
coordenada  r,¡  en  una  solución  estática  viene  dada  por  (10.59) 


Td  = Te 


l — 2 M 
\ i _ 2 M ’ 


(11.15) 


donde  Te  y T¿  son  los  periodos  de  la  señal  en  el  momento  de  emisión  y detección  respectivamente. 
Por  lo  tanto,  cuando  un  reloj  que  cae  hacia  el  centro  emite  pulsos  con  periodo  Te/  un  observador 
fijo  en  r = rd  notará  que  el  periodo  Td  medido  por  él  es  tanto  mayor  cuanto  más  se  aproxima  el 
reloj  al  radio  de  Schwarzschild,  hasta  tal  punto  que  el  efecto  Doppler  es  infinito  cuando  el  reloj 
está  en  r = 2 M.  El  radio  de  Schwarzschild  es  una  superficie  de  corrimiento  infinito  hacia  el  rojo. 


Hay  otra  indicación  más,  si  miramos  la  estructura  causal  de  la  solución  de  Schwarzschild, 
a través  de  las  geodésicas  nulas  radiales,  las  geodésicas  nulas  que  van  radialmente  de  r = 0 a 
r = oo  ó al  revés.  En  particular  tienen  dO  = dy>  = 0,  de  modo  que  su  ecuación  viene  dada  por 
(7.46) 


(11.16) 


La  expresión  para  t en  función  de  r es  por  lo  tanto. 


f dt\  2 / 2M\-2 

y ’ (ili7> 

2 Estrictamente  hablando  la  regularidad  de  R¡J,vp\RIJ'l'p>'  en  r = 2M  no  es  suficiente  para  concluir  que  se  trata  de 
una  singularidad  de  coordenadas,  ni  tampoco  el  hecho  de  que  numerosos  otros  invariantes  sean  finitos  en  este  punto.  El 
verdadero  argumento  es,  que  existe  un  cambio  de  coordenadas  tal  que  r = 2M  se  vuelve  regular,  como  veremos  dentro 
de  poco. 
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Figura  11.1:  Las  geodésicas  nulas  radiales  en  la  solución  de  Schwarzschild  en  las  coordenadas  de  Sch- 
warzschild  (t,  r,  9,  < p).  Para  r ^$>  2 M los  conos  de  luz  se  comportan  como  en  Minkowski,  pero  más  cerca 
del  radio  de  Schwarzschild  los  conos  se  cierran  y degeneran  en  r = 2 M.  Dentro  del  radio  de  Schwarzschild 
los  conos  han  cambiado  de  orientación  y apuntan  hacia  la  singularidad  en  r = 0.  En  estas  coordenadas  sin 
embargo  parece  que  no  es  posible  cruzar  el  radio  de  Schwarzschild  desde  el  exterior. 


cuya  solución  viene  dada  por 

t = ±(r  + 2 M log|r-2M|+C0),  (11.18) 

donde  Cq  es  una  constante  de  integración  y los  signos  indican  la  dirección  de  las  geodésicas:  el 
signo  posivito  corresponde  a geodésicas  salientes  y el  signo  negativo  a geodésicas  entrantes. 

Lejos  del  centro,  para  r V>  2 M,  el  segundo  término  es  despreciable  frente  al  primero  y los 
conos  de  luz  se  comportan  más  o menos  como  en  Minkowski,  es  decir,  hacen  ángulos  de  45°  con 
los  ejes  t y r.  Esto  es  de  esperar,  ya  que  la  solución  de  Schwarzschild  es  asintóticamente  plana 
y se  aproxima  a Minkowski  para  r — > oo.  Sin  embargo,  más  cerca  del  radio  de  Schwarzschild, 
el  término  logarítmico  se  vuelve  más  importante,  lo  que  indica  que  a los  rayos  de  luz  les  cuesta 
más  salir  del  pozo  potencial  creado  por  el  campo  gravitatorio.  Concretamente,  los  conos  de  luz 
se  cierran  cada  vez  vez  cuanto  más  nos  acercamos  al  radio  de  Schwarzschild  y en  r = 2 M están 
completamente  degenerados  (vease  Figura  11.1). 3 Dentro  del  radio  de  Schwarzschild,  tanto  las 
geodésicas  entrantes  como  las  salientes  apuntan  hacia  la  singularidad  y los  conos  han  cambiado 
de  orientación  y apuntan  hacia  la  singularidad  física  en  r = 0.  Esto  es  una  consecuencia  del  hecho 
de  que  para  r < 2 M,  las  componentes  fjn  y ÍJrr  de  la  métrica  cambian  de  signo  y las  coordenadas  t 
y r intercambian  los  papeles  de  coordenadas  temporal  y espacial.  Veremos  en  breve  el  significado 
físico  de  esta  propiedad. 

En  la  Figura  11.1  parece  que  ninguna  señal  de  luz  es  capaz  de  cruzar  el  radio  de  Schwarz- 
schild, ni  de  fuera  hacia  dentro,  ni  al  revés.  Dado  que  una  partícula  masiva  siempre  se  mueve 
dentro  de  su  cono  de  luz,  parece  que  tampoco  ninguna  partícula  masiva,  ni  ningún  observador 
es  capaz  de  entrar  a la  zona  r < 2 M.  En  las  coordenadas  de  Schwarzschild,  una  partícula  que  se 
cae  hacia  el  centro,  se  parecer  acercar  asintóticamente  al  radio  de  Schwarzschild,  pero  nunca  lo 
cruza. 

3Esta  es  en  realidad  la  causa  de  la  singulardad  de  coordenadas  en  el  radio  de  Schwarzschild:  las  direcciones  nulas 
= t ± (r  + 2M  log  \r  — 2M|)  son  linealmente  independientes  en  todos  la  variedad,  salvo  en  r = 2 M,  de  modo  que 
allí  formarían  una  base  degenerada. 
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Pero  esto  resulta  ser  una  conclusión  errónea,  debido  a que  las  coordenadas  (t,  r,  9 , <p)  no  son 
apropiadas  para  describir  lo  que  pasa  cerca  del  radio  de  Schwarzschild.  En  1939,  el  físico  esta- 
dounidense Robert  Oppenheimer  (1904  - 1967)  se  dió  cuenta  de  que  el  tiempo  de  caída  es  muy 
diferente,  si  lo  expresamos  en  el  tiempo  propio  de  la  partícula  en  caída  libre.  Para  esto  es  necesa- 
rio hacer  un  estudio  de  las  geodésicas  radiales  temporales. 

Para  calcular  las  geodésicas  temporales  radiales  estamos  interesados  en  la  componente  tem- 
poral de  la  ecuación  (7.36), 

i + 2T\rtr  = 0,  (11.19) 

donde  el  punto  se  refiere  a la  derivación  con  respecto  al  tiempo  propio  r.  Para  nuestro  caso  de 
la  solución  de  Schwarzschild,  podemos  simplificar  esta  expresión,  multiplicando  la  ecuación  por 
gtt  y escribiendo  el  símbolo  de  Christoffel  explícitamente  en  función  de  la  métrica  con  la  fórmula 
(7.52),  de  modo  que  (11.19)  se  convierte  en  (ejerc.) 


d_ 

dr 


= o, 


lo  que  se  puede  integrar  directamente  a 

/ 2 M\  . 

i1-—  ),  = L 


(11.20) 


(11.21) 


La  constante  de  integración  1 ha  sido  elegida  tal  que  la  ecuación  corresponde  a la  de  una  partícu- 
la que  cae  desde  infinito  con  velocidad  inicial  cero,  puesto  que  de  (11.21)  deducimos  que  dr  ss  dt 
para  r 2 M.  En  otras  palabras,  cerca  del  infinito  los  efectos  de  dilatación  temporal  especial- 
relativista  entre  el  observador  en  caída  libre  y el  observador  midiendo  con  el  tiempo  t son  des- 
preciables. Por  lo  tanto  podemos  concluir  que  la  coordenada  t corresponde  al  tiempo  propio  de 
un  observador  asintótico  en  el  infinito,  lejos  del  centro  de  la  solución.  Esto  ya  es  una  primera 
indicación  de  que  el  sistema  de  coordenadas  ( t , r,  9,  <p)  no  es  muy  apropiado  cerca  del  radio  de 
Schwarzschild,  ya  que  sabemos  que  el  tiempo  no  corre  igual  arriba  y abajo  en  un  potencial  gra- 
vitatorio. 

Por  lo  tanto,  las  ecuaciones  para  las  geodésicas  temporales  vienen  dadas  por  (11.21),  junto  con 
la  ecuación  (7.46),  que  en  nuestro  caso  es  de  la  forma 


(l-“) p - 

( 2 M\ 

(1 ) 

\ r ) 

V r ) 

Esta  última  expresión  la  podemos  rescribir  como 


2 


t 


2 M 

5 

r 


(11.22) 


(11.23) 


donde  en  la  última  igualdad  hemos  utilizado  la  ecuación  (11.21).  Lo  más  sencillo  es  ver  (11.23) 
como  una  ecuación  diferencial  para  r en  función  de  r, 


dr  I r 

dr  “ V 2 M’ 


(11.24) 


con  solución  (ejerc.) 

r = zVwÁro'  ~r3/2)'  (1L25) 

En  otras  palabras,  cayendo  desde  una  distancia  ro,  un  observador  O'  en  caída  libre  llega  al  radio 
de  Schwarzschild  r = 2 M e incluso  a la  singularidad  r = 0 en  un  intervalo  de  tiempo  propio  r 
finito.  Por  lo  tanto,  aunque  no  lo  parece  de  la  Figura  11.1,  es  perfectamente  posible  llegar  al  radio 
de  Schwarzschild,  cruzarlo  y llegar  a la  singularidad.  El  problema  está  en  que  la  Figura  11.1 
está  dibujado  en  coordenadas  (t,  r,  9,  <p),  que  son  las  coordenadas  de  un  observador  O en  r = oo. 
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Figura  11.2:  Trayectoria  de  un  observador  O'  en  caída  libre  visto  por  un  observador  lejano  O:  un  observa- 
dor en  caída  libre  O1  alcanza  la  singidaridad  después  de  un  tiempo  propio  finito.  Los  señales  de  luz  emitido 
por  el  observador  en  caída  libre  (líneas  puntuales)  siguen  geodésicas  radiales  nulas  y tardan  cada  vez  más 
en  llegar  al  observador  lejano  O,  que  cree  erróneamente  que  O1  sigue  la  trayectoria  A y que  nunca  cruza  el 
radio  de  Schivarzschild.  Una  vez  pasado  el  radio  de  Schwarzschild  O1  ya  no  tiene  manera  de  comunicarse 
con  O para  convencerle  de  lo  contrario. 


La  Figura  11.1  refleja  por  lo  tanto  no  lo  que  realmente  ocurre  con  O'  cerca  del  radio  de  Schwarz- 
schild, sino  más  bien  lo  que  pasa  con  el  observador  O'  según  el  punto  de  vista  del  observador 
O.  Y lo  único  que  tiene  éste  para  enterarse  son  las  señales  que  emite  O'  periódicamente.  Pero  ya 
hemos  visto  que  estas  señales  siguen  las  geodésicas  nulas  radiales  (11.18)  y llegan  por  lo  tanto 
a O con  intervalos  cada  vez  mayores,  como  consecuencia  de  sufrir  un  corrimiento  hacia  el  rojo 
cada  vez  mayor.  O ve  a O'  acercarse  asintóticamente  al  radio  de  Schwarzschild,  pero  nunca  lo  ve 
cruzarlo,  ya  que  la  señal  emitida  por  O'  en  r = 2 M llega  a O en  el  momento  t = oc . Las  señales 
que  O1  emite  después  de  cruzar  el  radio  de  Schwarzschild  no  salen  hacia  el  exterior  y no  llegarán 
nunca  a O,  ni  siquiera  después  de  una  cantidad  infinita  de  tiempo  t (véase  Figura  11.2). 


11.3.  Las  coordenadas  de  Eddington-Finkelstein 

Ya  hemos  visto  algunas  características  de  la  física  que  ocurre  cerca  del  radio  de  Schwarz- 
schild e incluso  hemos  deducido  algunas  propiedades  de  geodésicas  temporales  y nulas  para 
r < 2 M,  aunque  siempre  en  el  sistema  de  coordenadas  (t,  r,  8,  ip),  que  no  es  muy  fiable  cerca 
del  radio  de  Schwarzschild.  Para  entender  cómo  conectan  las  regiones  dentro  y fuera  del  radio 
de  Schwarzschild  y para  entender  mejor  la  estructura  causal  de  la  solución,  es  necesario  utilizar 
unas  coordenadas  que  no  sean  singulares  en  el  radio  de  Schwarzschild  y que  describan  bien  el 
comportamiento  de  objetos  físicos  (masivos  o sin  masa)  en  r = 2 M. 

Insprirados  por  la  expresión  (11.18)  para  las  geodésicas  radiales  nulas  entrantes  (con  signo 
menos),  consideramos  la  siguiente  redefinición  de  la  coordenada  temporal 

t = t + 2Mlog(r-2AÍ).  (11.26) 

Nótese  que  el  cambio  de  coordenadas  es  tal  que  lejos  del  radio  de  Schwarzschild,  el  término  lo- 
garítmico es  despreciable  con  repecto  al  término  lineal  y t ss  t.  Sin  embargo  cuando  r ~ 2 M,  la 
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Figura  11.3:  La  solución  de  Schwarzschild  en  coordenadas  avanzadas  de  Eddington-Finkelstein.  Los  conos 
de  luz  se  inclinan  tanto  más  cuanto  más  cerca  de  la  singularidad.  El  radio  de  Schwarzschild  r = 2 M es 
especial,  porque  allí  la  inclinación  es  tanto  que  ni  las  geodésicas  mdas  salientes  llegan  al  infinito.  El  radio 
de  Schwarzschild  forma  un  horizonte  deja  entrar  influencias  causales,  pero  no  salir.  Un  observador  exterior 
no  puede  ver  lo  que  ocurre  dentro  y un  observador  dentro  no  tiene  manera  de  evitar  la  singularidad. 


coordenada  temporal  t difiere  mucho  del  tiempo  t,,  medido  por  el  observador  lejano  O. 

No  es  difícil  de  ver  que  las  expresiones  (11.18)  para  las  geodésicas  radiales  nulas  en  coorde- 
nadas de  Eddington-Finkelstein  son 


t = — r + Co,  i = r + 4Mlog  |r  — 2M|  + Co,  (11.27) 

para  las  geodésicas  entrantes  y salientes  respectivamente.  Nótese  que  las  geodésicas  entrantes 
tienen  una  forma  particularmente  fácil  (esta  es  la  razón  por  la  que  hemos  cambiado  a estas  coor- 
denadas) y que  no  divergen  en  r — 2 M,  sino  que  pasan  desde  r = oo  hasta  r = 0 sin  problema. 
En  particular,  veremos  que  estas  coordenadas  (t,  r,  9 , p)  no  son  singulares  en  el  radio  de  Schwarz- 
schild y nos  permiten  trazar  sin  problemas  trayectorias  hasta  r < 2 M.  Las  coordenadas  (t,  r,  9 , p) 
se  llaman  las  coordenadas  ( avanzadas )4  de  Eddington-Finkelstein,  introducidas  por  David  Finkelstein 
(1929  - ) en  1958.5 

En  la  Figura  11.3  se  puede  ver  que  el  comportamiento  de  los  conos  de  luz  en  las  coordenadas 
de  Eddington-Finkelstein  es  distinto  que  en  las  coordenadas  de  Schwarzschild.  Para  r 2 M,  los 
conos  se  comportan  como  en  el  espacio  de  Minkowski,  igual  que  en  las  coordenadas  de  Schwarz- 
schild, pero  cerca  del  r = 2 M,  los  conos  empiezan  a inclinarse  hacia  la  singularidad.  Las  geodési- 
cas radiales  nulas  entrantes  siempre  mantienen  el  mismo  ángulo  de  45°  con  el  eje  r,  pero  las 
geodésicas  salientes  tienen  un  ángulo  cada  vez  mayor,  cuanto  más  se  acercan  a r = 2 M,  ya  que 
a las  geodésicas  salientes  les  cuesta  cada  vez  más  salir  hacia  el  infinito,  debido  a la  curvatura  del 
espacio.  El  radio  de  Schwarzschild  es  un  punto  especial,  porque  allí  la  inclinación  de  los  conos 

4Se  suele  añadir  a estas  coordenadas  el  adjetivo  "avanzada",  porque  también  se  pueden  construir,  a partir  de  las 
geodésicas  salientes,  unas  coordenadas  (í,  r,  6,  ip),  con  í = t — 2M  log(r  — 2M),  llamadas  las  coordenadas  retardadas  de 
Eddington-Finkelstein.  Estará  claro  que  la  diferencia  entre  las  coordenadas  avanzadas  y retardadas  consiste  básicamente 
en  el  intercambio  de  las  propiedades  de  las  geodésicas  entrantes  y salientes.  Aquí  supondremos  que  si  no  añadimos  el 
adjetivo  explícitamente,  nos  referiremos  a las  avanzadas.  Discutiremos  brevemente  las  retardadas  un  poco  más  adelante. 

5 El  primero  en  construir  un  sistema  de  coordenadas  que  no  fuese  singular  en  r = 2 M fue  Arthur  Eddington,  aunque 
no  parece  haberse  dado  cuenta  del  significado  físico.  El  primero  en  entender  que  la  singularidad  en  el  radio  de  Schwarz- 
schild es  una  singularidad  de  coordenadas  y no  una  singularidad  física  fue  el  cura  y físico  belga  George  Lemaitre  (1894- 
1966)  en  1933. 
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de  luz  es  tanta  que  las  geodésicas  nulas  salientes  forman  un  ángulo  de  90°  con  el  eje  r.  Una  señal 
de  luz,  emitido  desde  allí  radialmente  hacia  el  exterior,  se  quedará  a distancia  fija  r = 2 M del 
centro.  Para  r < 2 M,  la  inclinación  de  los  conos  es  aún  mayor  e incluso  las  geodésicas  salientes 
están  dirigidas  hacia  el  centro  y acaban  en  la  singularidad. 

De  estas  observaciones  podemos  derivar  dos  efectos  físicos  importantes  de  la  solución  de  Sch- 
warzschild.  Primero,  dado  que  tanto  las  señales  de  luz,  tanto  entrantes  como  salientes,  emitidas 
desde  la  región  r < 2 M están  dirigida  hacia  el  centro,  vemos  que  el  radio  de  Schwarzschild  actúa 
como  un  horizonte  de  sucesos.  Como  escribió  el  ísico  estadounidense  David  Finkelstein  (1929  - ) en 
1958,  "la  superficie  r = 2 M es  [...]  verdaderamente  una  membrana  unidireccional:  las  inñuencias 
causales  sólo  pueden  atravesarla  en  una  dirección."  Ningún  evento  en  la  región  r < 2 M puede 
influenciar  lo  que  ocurre  fuera  del  radio  de  Schwarzschild  ya  que  los  conos  de  luz  no  alcanzan 
hasta  la  región  exterior.  Para  un  observador  exterior  es  por  lo  tanto  imposible  obtener  informa- 
ción sobre  lo  que  occure  dentro,  ya  que  desde  allí  ninguna  señal  puede  escapar  hacia  el  infinito. 
Lo  mismo  ocurre  para  partículas  (u  observadores)  masivos:  una  vez  cruzado  el  horizonte,  ya  no 
hay  manera  de  volver  a la  región  asintóticamente  plana. 

Una  singularidad  rodeada  por  un  horizonte  de  sucesos,  que  evita  ver  lo  que  pasa  dentro  del 
horizonte,  es  un  agujero  negro,  uno  de  los  fenómenos  más  violentos  en  la  Naturaleza.  Obsérvese 
que  el  horizonte  r = 2 M no  es  una  superficie  temporal,  sino  una  superficie  nula,  ya  que  es  la  su- 
perficie en  la  que  se  mueven  las  señales  de  luz  emitidas  hacia  el  exterior  desde  este  punto.  Merece 
la  pena  enfatizar  que  la  apareción  del  horizonte  es  una  propiedad  global,  debido  a la  orientación 
de  los  conos  de  luz  en  toda  la  región  r < 2 M,  es  decir,  debido  a la  estructura  causal  de  la  solu- 
ción de  Schwarzschild.  Localmente  es  espacio  es  completamente  regular  en  r = 2 M,  sin  ninguna 
propiedad  geométrica  particular.  Un  observador  puntual  en  caída  libre  no  notaría  ningún  efecto 
físico  al  cruzar  el  horizonte.  Esto  es  una  consecuencia  del  Principio  de  Equivalencia,  que  sigue 
válido  en  cualquier  punto  del  espaciotiempo  en  general  y el  el  radio  de  Schwarzschild  en  parti- 
cular. 


El  segundo  efecto  físico  se  trata  de  la  singularidad:  dado  que  tanto  las  geodésicas  entrantes  co- 
mo las  salientes  acaban  en  la  singularidad  y dado  que  cualquier  partícula  (u  observador)  masivo 
siempre  queda  confinado  dentro  de  su  propio  cono  de  luz,  está  claro  que  también  las  partícu- 
las masivas  acabarán  inevitablemente  en  la  singularidad.  Es  imposible  quedarse  en  reposo  a un 
r = ro  < 2 M fijo  del  centro.  Cualquier  curva  temporal  o nula  que  cruce  el  horizonte  está  desti- 
nada a darse  con  la  singularidad  y desaparecer  del  espaciotiempo.  Esto  es  una  consecuencia  de 
que  para  r < 2 M la  coordenada  r es  una  coordenada  temporal,  como  ya  mencionamos  antes,  y 
que  la  singularidad  en  r = 0 es  una  superficie  espacial  (no  temporal)  y además  está  en  el  futu- 
ro causal  de  cualquier  observador  que  se  atreve  cruzar  el  horizonte.  Una  vez  cruzado  r = 2 M, 
avanzar  en  la  dirección  radial  y acabar  en  la  singularidad  es  igual  de  inevitable  que  en  el  espacio 
de  Minkowski  evolucionar  en  el  tiempo  y cruzar  una  superficie  temporal  t = íq. 


En  realidad  ya  hemos  visto  algunas  de  estas  propiedades  de  la  geometría  dentro  del  radio  de 
Schwarzschild  de  una  u otra  forma  en  las  Figuras  11.1  y 11.2,  pero  allí  aparecieron  en  las  coor- 
denadas (í,  r,  0,  ip),  que  son  solamente  fiables  en  la  región  r > 2 M.  Ahora,  en  las  coordenadas  de 
Eddington-Finkelstein  podemos  afirmar  estas  conclusiones,  ya  que  son  regulares  en  el  horizonte, 
como  se  puede  ver  de  la  forma  de  la  métrica  en  estas  coordenadas.  De  (11.26)  vemos  que 


dt  = dt  — 


2 M 


1 - 


2M  \ -1 


J 


dr , 


(11.28) 


de  modo  que  sustituyendo  esta  expresión  en  la  métrica  (11.13)  obtenemos  la  siguiente  expresión 
para  la  solución  de  Schwarzschild  en  coordenadas  avanzadas  de  Eddington-Finkelstein: 


ds¿  = ( 1 — 


/ 2 M \ ~o  4M  - , / 2M  \ o o 

j^l — Jdt2  — — — dtdr  — ^1-1 — — Jdr2  — r2dfl\. 


4AÍ 


2 M\ 


Esta  claro  que  la  métrica  ya  no  diverge  en  r = 2 M,  aunque  gtt  sea  cero.6 


(11.29) 


6 Estrictamente  hablando  el  cambio  de  coordenadas  (11.26)  sólo  está  definido  para  r > M.  Sin  embargo  es  fácil  de  ver 
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Sin  embargo,  obsérvese  que,  debido  al  término  cruzado  gtr,  en  estas  coordenadas  la  métrica 
(11.29)  ya  no  tiene  la  simetría  t — > —i  que  uno  esperaría  de  una  solución  estática.  Pero  ya  he- 
mos dicho  antes  que,  en  lugar  de  las  coordenadas  avanzadas  de  Eddington-Finkelstein  (11.26), 
podíamos  haber  elegido  las  coordenadas  retardadas 

i = t - 2 M log(r  - 2 M),  (11.30) 


de  modo  que  la  métrica  sería 


ds2 


/ ¿M  \ 4 M 

( 1 ) dP  + dtdr  — 

\ r / r 


dr 2 — r2díl \. 


(11.31) 


Obsérvese  que  la  diferencia  entre  estas  dos  expresiones  es  el  signo  del  término  cruzado,  de  modo 
que  la  transformación  t i mapea  una  métrica  en  la  otra.  En  la  región  r > 2 M,  las  transforma- 
ciones (11.26)  y (11.30)  mapean  la  métrica  (11.13)  en  (11.29)  y (11.31)  respectivamente,  de  modo 
que  fuera  del  radio  de  Schwarzschild,  estas  tres  métricas  corresponden  a la  misma  solución.  Sin 
embargo,  dentro  del  radio  de  Schwarzschild  (11.29)  y (11.31)  no  son  equivalentes,  ya  que  el  cam- 
bio de  coordenadas  t f no  está  bien  definido  para  r < 2 M.  El  hecho  de  que  estas  dos  métricas 
no  sean  físicamente  equivalentes  se  ve  en  el  comportamiento  de  las  geodésicas  radiales  nulas. 
No  es  difícil  de  ver  que  en  las  coordenadas  (i,  r.  0,  y)  son  las  geodésicas  salientes  las  que  siempre 
tienen  un  ángulo  constante  de  45°  con  el  eje  r y que  los  conos  de  luz  cerca  de  la  singularidad  se 
inclinan  hacia  el  exterior  (ejerc.).  El  radio  de  Schwarzschild  r = 2 M en  (11.31)  corresponde  a una 
membrana  que  sólo  deja  pasar  influencias  causales  desde  el  interior  hacia  el  exterior,  un  tipo  de 
"agujero  blanco",  justo  al  revés  que  en  las  coordenadas  (t,  r,  9,  y). 

La  solución  de  esta  extraña  paradoja  es  que  las  coordenadas  avanzadas  y retardadas  de 
Eddington-Finkelstein  describen  la  misma  región  del  espaciotiempo  para  r > 2 M,  pero  la  parte 
con  r < 2M  en  coordenadas  (t.  r,  9,  <p)  no  es  la  misma  que  la  parte  con  r < 2 M en  coordena- 
das (t,  r,  9,  tp).  Las  coordenadas  avanzadas  describen  una  región  asintóticamente  plana  con  una 
singularidad  cubierta  por  un  horizonte  en  el  futuro.  Una  vez  cruzado  este  horizonte  es  impo- 
sible volver  a la  parte  asintóticamente  plana.  Las  coordenadas  retardadas  describen  la  misma 
región  asintóticamente  plana,  pero  con  una  singularidad  cubierta  por  un  horizonte  en  el  pasado. 
Influencias  causales  pueden  salir  de  la  singularidad,  cruzar  este  horizonte  y llegar  a la  región 
asintóticamente  plana,  pero  una  vez  cruzado  este  horizonte  es  imposible  volver  a la  singularidad 
original  (véase  Figura  11.4). 

Matemáticamente  lo  que  ocurre  es  que  ninguna  de  las  dos  coordenadas  describe  la  variedad 
completa,  sólo  parches  de  ella.  En  la  Figura  11.4,  la  parte  asintóticamente  plana  corresponde 
a la  región  I y el  horizonte  r = 2 M corresponde  con  las  líneas  continuas  de  45°.  Detrás  del 
horizonte  hay  dos  regiones,  II  y II',  mutuamente  simétricas  en  el  tiempo,  cada  una  con  su  propia 
singularidad.  Las  coordenadas  avanzadas  cubren  las  regiones  I y II,  mientras  las  coordenadas 
retardadas  las  regiones  I y II'. 

Se  podría  preguntar  si  existe  un  sistema  de  coordenadas  que  cubra  todas  estas  regiones  a la 
vez.  La  respuesa  es  sí,  las  llamadas  coordenadas  de  Kruskal,  aunque  nos  llevaría  demasiado  lejos 
dar  la  derivación  en  detalle.  En  estas  coordenadas  la  métrica  viene  dada  por 


ds 1 = 


16AP 


e~r/2M(dT2  - dR 2)  - r2dn¡, 


(11.32) 


donde  las  coordenadas  T y R están  relacionadas  con  las  coordenadas  de  Schwarzschild  t y r a 
través  de 


T = er/4MvV  - 2 M sinhf— V R = er/4MVr  - 2 M coshf— V (11.33) 

V4  M)  V4  M) 

que  el  cambio  de  coordenadas  i = t + 2 M log(2Aí  — r)  aplicado  a la  parte  r < 2 M de  la  métrica  (11.13)  lleva  a la  misma 
expresión,  lo  que  demuestra  que  las  dos  partes  disconexas  r < 2 M y r > 2 M de  (11.13)  en  realidad  describen  la  misma 
solución,  y que  las  coordenadas  de  Eddington-Finkelstein  (í , r,  9,  ip)  cubren  ambas  regiones. 
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Figura  11.4:  La  solución  de  Schwarzschild  en  coordenadas  de  Kruskal:  la  luz  se  mueve  en  líneas  rectas  con 
ángulos  de  45° , de  modo  que  la  orientación  de  los  cono  de  luz  es  la  misma  en  todo  el  espacio.  La  solución 
de  Schwarzschild  consiste  de  2 partes  asintóticamente  planas  I y V,  conectadas  por  un  agujero  de  gusano 
en  R = T = 0.  Las  regiones  I y V están  separado  por  un  horizonte  de  sucesos  de  las  regiones  II  y IV, 
que  contienen  una  singularidad  espacial  en  el  futuro  y el  pasado  respectivamente.  Las  singularidades  están 
representadas  por  la  línea  gorda  interrumpida  y los  horizontes  por  la  línea  gorda  ininterrumpida.  Líneas  de 
t=cte  y r=cte  están  representadas  respectivamente  por  las  líneas  finas  interrumpidas  y las  líneas  de  puntos. 


de  modo  que 

T2  - R2  = er/2M{r  - 2 M)  (11.34) 

No  sólo  estas  coordenadas  cubren  las  regiones  I,  II  y II'  a la  vez,  sino  también  resulta  que  la 
variedad  tiene  otra  región  asintóticamente  plana  extra,  la  región  V,  que  ninguna  de  las  coorde- 
nadas de  Eddington-Finkelstein  podía  ver.  Se  puede  demostrar  que  las  coordenadas  de  Kruskal 
forman  la  extensión  máxima  de  la  solución  de  Schwarzschild,  es  decir,  que  cubren  toda  la  variedad, 
sin  que  queden  más  regiones  por  descubrir. 

En  estas  coordenadas,  tanto  las  geodésicas  entrantes  como  las  salientes  forman  ángulos  de 
45°  con  los  ejes  T y R,  de  modo  que  los  conos  de  luz  (los  triángulos  sólidos  en  Figura  11.4)  se 
comportan  como  en  el  diagrama  del  espacio  de  Minkowski.  Sin  embargo,  de  (11.34)  vemos  que 
las  curvas  con  r =cte  forman  hipérbolas  y los  planos  t =cte  forman  ángulos  más  grandes  para 
tiempos  más  avanzados.  El  horizonte  r = 2 M es  una  superficie  nula,  ya  que  también  forma 
un  ángulo  de  45°  con  los  ejes  y se  ve  claramente  que  una  partícula  que  entra  en  la  región  II  no 
podrá  emitir  señales  a la  región  I y acabará  en  la  singularidad  (la  línea  gorda  punteada),  que  es 
una  superficie  espacial  y por  lo  tanto  inevitable. 

En  la  región  II'  pasa  justamente  lo  contrario:  cualquier  señal  emitida  desde  aquí  forzosamente 
tiene  que  salir  hacia  las  regiones  asintóticamente  planas  I o I'.  Una  vez  en  estas  regiones,  ya  no 
hay  manera  de  volver  a la  región  II'.  Ningún  evento  en  las  regiones  I o I'  pueden  influenciar  lo 
que  ocurre  en  II',  ya  que  la  región  II'  está  en  el  pasado  de  I y I'.  Nótese  que  tanto  en  la  zona  II 
como  en  la  zona  II',  la  coordenada  t es  espacial  y r es  temporal,  como  ya  habíamos  mencionado 
antes. 

En  las  coordenadas  T y R,  la  solución  no  sólo  es  completamente  regular  en  r = 2M,  sino  que 
también  es  simétrica  bajo  la  inversión  de  la  coordenada  temporal  T — » — T,  como  uno  espera  de 
una  solución  estática.  Obsérvese  que  bajo  T — > — T las  regiones  I y I'  son  invariantes  y II  y II' 
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se  intercambian.  Pero  más  sorprendente  es  que  también  hay  una  simetría  bajo  inversión  de  la 
coordenada  radial  R — + —R,  que  deja  II  y II'  invariantes  e intercambia  I y Y.  La  región  Y es  por  lo 
tanto  un  tipo  de  imagen  de  espejo  de  la  región  I,  o sea,  otro  espacio  asintóticamente  plano,  donde 
observadores  y partículas  pueden  caer  en  la  singularidad  de  la  región  II.  Las  regiones  I y I'  están 
conectadas  en  el  punto  T = R = 0 por  un  agujero  de  gusano,  llamado  un  puente  de  Einstein-Rosen, 
pero  la  estructura  causal  es  tal  que  no  pueden  pasar  influencias  causales  de  una  región  a la  otra. 
Observadores  de  una  región  sí  pueden  ponerse  en  contacto  con  observadores  de  la  otra  región, 
si  los  dos  se  atreven  a entrar  en  la  región  II:  una  vez  allí  se  podrán  influenciar  mutuamente  antes 
de  acabar  en  la  singularidad,  pero  nunca  podrán  volver  a influenciar  eventos  en  sus  antiguos 
paraderos  I y I'. 


11.4.  Colapso  gravitacional  y formación  de  agujeros  negros 


Una  se  podría  preguntar  si  agujeros  negros  tipo  Schwarzschild  realmente  existen  en  la  Na- 
turaleza, o si  sólo  son  una  solución  matemática,  sin  realidad  física.  La  respuesta  es  un  poco  am- 
bivalente: realmente  se  pueden  llegar  a formar  agujeros  negros,  por  ejemplo  al  final  de  la  vida 
de  estrellas  muy  masivas,  pero  a pesar  de  que  tienen  muchas  de  las  características  que  hemos 
comentado  en  la  sección  anterior,  no  son  exactamente  como  la  extensión  máxima  de  la  solución 
de  Schwarzschild.  La  gran  diferencia  está  en  que  los  agujeros  negros  en  la  Naturaleza  están  for- 
mados dinámicamente  en  un  proceso  de  colapso  gravitacional  y por  lo  tanto  no  tienen  la  simetría 
de  inversión  temporal  de  una  solución  estática  como  la  extensión  maximal  (11.32). 

Ya  hemos  visto  en  la  sección  11.1,  que  la  solución  (11.11)  en  realidad  se  corresponde  con  la 
parte  exterior  de  un  campo  gravitatorio  causado  por  un  objeto  con  masa  m = M/Gy¡  en  el  centro. 
En  circunstancias  normales,  la  masa  ocupa  una  esfera  con  un  radio  Rq  mayor  que  2 M,  de  modo 
que  la  solución  exterior  es  la  métrica  (11.11)  y la  interior  es  la  solución  interior  de  Schwarzschild, 
que  mencionamos  antes.  Sin  embargo,  si  comprimimos  la  masa  en  un  volumen  más  pequeño,  la 
gravedad  en  la  superficie  aumentará,  ya  que  el  potencial  gravitatorio  varía  como  $ = —Gnir/t.7 

Al  comprimir  la  masa  en  un  volumen  más  pequeño,  aumentará  también  la  velocidad  de  es- 
cape, la  velocidad  inicial  necesario  para  que  una  partícula  pueda  salir  del  pozo  potencial  de  un 
objeto  masivo  y llegar  al  infinito.  Desde  la  ley  de  conservación  de  energía  de  la  mecánica  new- 
toniana,  se  puede  calcular  fácilmente  que  la  velocidad  de  escape  ve  de  un  objeto  con  masa  m y 
radio  R viene  dada  por 

¡2  GNm. 

Ve  = \j  R ■ (11.35) 

En  1795  el  matemático  francés  Pierre  Simón  Laplace  (1749  - 1827)  se  dió  cuenta  de  que  la  ve- 
locidad de  escape  superaría  la  velocidad  de  la  luz  si  se  comprimiese  toda  la  masa  en  un  radio 
R = 2G',v//í.  Escribe  en  su  Traité  de  la  Méchanique  Céleste  en  1799:  Una  estrella  luminosa  de  la 
misma  densidad  que  la  tierra , y cuyo  diámetro  es  250  veces  mayor  que  el  sol , no  dejaría  llegar 
por  su  atracción  ningún  rayo  hasta  nosotros;  por  lo  tanto  es  posible  que  los  más  grandes  cuerpos 
luminosos  del  Universo  sean,  por  esa  razón,  invisibles  para  nosotros.  Sorprendentemente,  el  ra- 
dio crítico  para  la  velocidad  de  escape,  calculado  con  métodos  puramente  newtonianos,  coincide 
exactamente  con  el  radio  de  Schwarzschild,  el  radio  desde  donde  la  luz  ya  no  puede  salir  hacia 
el  exterior.8  La  interpretación,  sin  embargo  es  distinta,  ya  que  en  la  mecánica  newtoniana,  la  ve- 
locidad de  la  luz  no  es  un  límite  superior,  de  modo  que  la  "estrella  negra"  de  Laplace  no  es  un 
agujero  negro  en  el  sentido  estricto  de  la  palabra. 

7Esto  no  implica  que  la  gravedad  a distiancia  ro  > Ro  aumente:  el  potencial  gravitatorio  a distancia  ro  fuera  de  la 
masa  es  independiente  del  volumen  que  ocupa  la  masa.  Si  el  Sol  colapsara  en  un  agujero  negro,  la  trayectoria  de  la  Tierra 
no  cambiarla  en  absoluto. 

8Quizá  no  es  tan  sorprendente:  G^m  es  la  única  combinación  con  dimensión  de  longitud  que  se  puede  construir,  y el 
factor  2 viene  justamente  de  ajustar  en  (11.12)  la  constante  de  integración  M con  la  mecánica  newtoniana. 
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Figura  11.5:  El  colapso  gravitatorio  en  las  coordenadas  de  Eddington-Finkelstein:  una  masa  m ocupa 
inicialmente  un  volumen  mayor  que  su  radio  de  Schwarzschild  2G¿vto,  pero  según  se  va  contrayendo, 
aumenta  la  curvatura  del  espacio  cerca  del  centro.  Cuando  la  masa  se  haya  comprimido  dentro  del  radio  de 
Schwarzschild,  se  forma  un  agujero  negro,  con  su  singularidad  y su  horizonte.  Toda  la  materia  de  la  masa 
original  termina  en  la  singularidad  y desaparece  del  espaciotiempo. 


En  la  relatividad  general,  más  que  la  velocidad  de  escape,  la  cantidad  física  importante  es  la 
curvatura  del  espaciotiempo:  cuanto  más  se  comprime  la  masa,  tanto  más  aumenta  la  curvatura 
alrededor  del  objeto  y una  vez  que  toda  la  masa  está  comprimido  en  un  volumen  más  pequeño 
que  el  radio  de  Schwarzschild,  ya  no  hay  manera  de  parar  el  colapso  gravitacional.  La  curvatura 
es  tanto  que  la  luz  se  queda  atrapada,  ya  que  incluso  las  geodésicas  nulas  están  dirigidas  hacia  el 
centro.  Se  forma  por  lo  tanto  un  horizonte  de  sucesos  y,  debido  al  teorema  de  Hawking  y Penrose, 
también  una  singularidad.  Por  la  estructura  causal  del  espaciotiempo  dentro  del  horizonte,  toda 
la  materia  del  objeto  original  acabará  en  la  singularidad  y desparecerá  del  espaciotiempo  (véase 
Figura  11.5),  tal  como  se  dió  cuenta  Oppenheimer  en  1939. 

Por  lo  tanto  no  es  preciso  disponer  de  una  masa  grande  para  poder  formar  un  agujero  negro, 
por  lo  menos,  en  principio.  Más  que  de  la  masa,  la  formación  de  una  agujero  negro  depende  de 
la  densidad:  cualquier  masa  m puede  formar  un  horizonte  y una  singularidad  si  se  comprime 
dentro  del  radio  de  Schwarzschild  correspondiente  a esa  masa,  es  decir  en  un  volumen  r = 
2 Gniti.  El  radio  de  Schwarzschild  del  Sol  es  aproximadamente  3 km  y el  de  la  Tierra  unos  9 m rn. 

En  la  práctica  no  hay  fuerza  en  la  Naturaleza  capaz  de  comprimir  ni  el  Sol,  ni  la  Tierra  dentro 
de  sus  respectivos  radios  de  Schwarzschild.  En  el  caso  de  planetas  como  la  Tierra,  la  repulsión 
entre  los  electrones  de  los  átomos  es  suficiente  para  contrarrestar  la  fuerza  gravitatoria  y pre- 
venir un  colapso  gravitacional.  En  objetos  más  masivos,  como  estrellas,  la  presión  gravitacional 
hacia  dentro  es  tan  grande  que  la  materia  forma  un  plasma  tan  caliente  que  hay  fisión  nuclear. 
En  grandes  líneas,  4 protones  se  juntan  para  formar  un  núcleo  de  helio.  La  energía  térmica  pro- 
ducida por  estas  reacciones  nucleares  contraresta  la  presión  gravitatoria,  de  modo  que  la  estrella 
se  encuentra  en  un  equilibrio  térmico-gravitatorio. 

Sin  embargo,  cuando  a la  estrella  se  le  acaba  el  combustible,  ya  no  es  capaz  de  producir  la 
energía  términa  necesaria  para  mantener  el  equilibrio.  Lo  que  pasa  entonces,  depende  básica- 
mente de  la  masa  de  la  estrella  considerada.  Para  estrellas  pequeñas  y medianas,  como  el  Sol,  la 
gravedad  comprimirá  la  estrella  en  un  volumen  comparable  con  la  Tierra,  con  una  densidad  entre 
104  hasta  109  kg/cm 3.  Allí  la  presión  del  gas  degenerado  de  electrones  y átomos  completamente 
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ionizados  será  lo  suficiente  para  volver  a mantener  el  equilibrio.  La  estrella  se  ha  convertido  en 
una  enana  blanca,  llamada  así  por  su  tamaño  y su  color,  debido  a su  alta  temperatura. 

En  1931  el  astrofísico  Subrahmanyan  Chandrasekhar  (1910  - 1995)  demostró  que  una  enana 
blanca  no  puede  tener  una  masa  mayor  que  unos  1,4  masas  solares.  Para  estrellas  con  masas  su- 
periores al  límite  de  Chandrasekhar,  la  presión  del  gas  degenerado  no  es  capaz  de  contrarrestar  la 
fuerza  gravitacional.  En  este  caso,  la  estrella  será  comprimida  en  un  radio  de  unos  pocos  kilóme- 
tros. La  presión  gravitatoria  es  tan  fuerte  que  los  electrones  están  comprimidos  dentro  de  los 
núcleos  de  los  átomos  y reaccionarán  con  los  protones  para  formar  una  bola  inmensa  de  neutro- 
nes, llamada  una  estrella  de  neutrones.  A estas  alturas,  la  única  fuerza  que  puede  resistir  la  presión 
gravitacional  es  la  repulsión  fermiónica  entre  los  neutrones.  La  densidad  típica  de  una  estrella  de 
neutrones  es  de  unos  101'  kg/cm3. 

En  1939  Oppenheimer  y collaboradores  calcularon  el  equivalente  del  límite  de  Chandrasekhar 
para  estrellas  de  neutrones,  el  llamado  límite  de  Oppenheimer-Volkov  y encontraron  que  la  repul- 
sión entre  los  neutrones  no  es  suficiente  para  contrarrestar  la  fuerza  gravitatoria  en  estrellas  de 
neutrones  con  masas  superiores  a unos  2 masas  solares.  En  este  caso  ya  no  hay  ninguna  fuerza 
capaz  de  controlar  la  compresión  gravitacional  y la  estrella  colapsará  a su  radio  de  Schwarzschild 
y más  allá  ... 

Einstein  y Eddington,  el  padre  de  la  teoría  de  la  evolución  estelar,  se  opusieron  firmemente  a 
la  idea  de  que  un  estrella  podría  colapsar  a un  solo  punto  y renunciaron  a dar  a la  solución  de 
Schwarzschild  algún  significado  físico.  Pero  hoy  en  día  sabemos  que  existen  estrellas  con  masas 
de  decenas  y cientos  de  veces  la  del  Sol,  así  que,  a pesar  de  que  puedan  perder  mucha  masa  a lo 
largo  de  su  evolución,  es  posible  que  algunas  estrellas  saturen  el  límite  de  Oppenheimer-Volkov 
y se  conviertan  en  agujeros  negros. 

Además,  la  evolución  estelar  no  es  la  única  fuente  de  agujeros  negros.  Los  astrónomos  lo 
sospecharon  desde  hace  tiempo,  pero  en  los  últimos  años  han  encontrado  pruebas  convincentes 
de  que  existen  agujeros  negros  snpermasivos  en  los  centros  de  galaxias,  con  masas  del  orden  de 
109  masas  solares  y radios  de  Schwarzschild  del  orden  de  109  km.  Al  otro  lado  de  la  escala  se 
sospecha  que  también  existen  agujeros  negros  primordiales,  que  no  se  formaron  en  colapsos  gra- 
vitacionales  de  estrellas,  sino  en  las  primeras  fases  de  la  existencia  del  universo,  debido  a las 
fluctuaciones  de  densidad.  Se  calcula  que  estas  agujeros  negros  primordiales  tendrían  una  masa 
del  orden  de  1012  kg  (en  comparación,  la  Tierra  tiene  una  masa  del  orden  de  1024  kg)  y un  radio 
de  Schwarzschild  de  unos  10_14m. 

Queda  por  preguntar  ¿qué  es  lo  que  pasa  con  un  observador  que  se  cae  en  un  agujero  ne- 
gro? Ya  sabemos  que  acabará  inevitablemente  en  la  singularidad,  pero  antes  de  esto,  ¿qué  ve 
y qué  siente?  Ya  hemos  dicho  que  el  horizonte  geométricamente  hablando  es  un  punto  perfec- 
tamente regular  y que  un  observador  puntual  en  caída  libre  no  notaría  nada  al  cruzarlo.  Por 
la  estructura  causal  del  espaciotiempo  está  claro  que  el  observador  no  puede  ver  la  singulari- 
dad mientras  que  está  fuera  del  radio  de  Schwarzschild,  ya  que  ninguna  señal  puede  salir  del 
horizonte  para  advertirle  de  lo  que  le  espera.  Pero  tampoco  una  vez  dentro  es  capaz  de  ver  la 
singularidad:  de  los  diagramas  de  espaciotiempo  está  claro  que  no  pueden  salir  señales  de  la 
singularidad  hacia  un  r < 2 M.  La  coordenada  radial  es  una  coordenada  temporal  para  r < 2 M, 
así  que  querer  ver  la  singularidad  una  vez  dentro  del  radio  de  Schwarzschild  es  como  querer  ver 
en  el  futuro.  El  observador  por  lo  tanto  no  ve  el  rostro  de  la  singularidad  hasta  que  da  con  ella. 

Esto  no  implica  que  el  viaje  hacia  r = 0 sea  agradable,  por  lo  menos  no  para  observadores 
reales,  es  decir,  observadores  no  puntuales.  Objetos  y observadores  con  una  extensión  espacial 
sufrirán  grandes  fuerzas  de  marea,  debido  a la  inhomogeneidad  del  campo  gravitatorio.  En  un 
potencial  gravitatorio  que  varía  como  1 /r,  la  fuerza  de  marea,  es  decir  la  diferencia  entre  la  fuerza 
a distancia  r y r + Ar  es  proporcional  a M/r3,  de  modo  que  cerca  de  la  singularidad,  las  fuerzas 
de  marea  son  inmensas.  No  sólo  la  diferencia  de  la  fuerza  gravitacional  entre  la  cabeza  y los 
pies  estira  y desgarra  al  observador  (o  lo  que  queda  de  él)  longitudinalmente  como  un  potro  de 
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tortura  cósmico,  también  transversalmente  le  comprime  en  una  superficie  r2  Aíl  cada  vez  menor. 

Estas  fuerzas  de  marea  son  muy  grandes,  cerca  de  la  singularidad,  pero  esto  no  necesariamen- 
te implica  que  lo  sean  en  el  horizonte.  Para  agujeros  negros  estelares  y primordiales  efectivamente 
lo  son:  para  un  agujero  negro  con  la  masa  del  Sol,  un  humano  ya  no  sobreviviría  las  fuerzas  a una 
distancia  de  200  km,  unos  66  radios  de  Schwarzschild.  Pero  en  un  agujero  negro  supermasivo  de 
109  masas  solares,  el  radio  de  Schwarzschild  es  109  veces  mayor,  de  modo  que  enr  = 2 M la 
curvatura  y las  fuerzas  de  marea  todavía  no  son  muy  grandes.  En  este  caso,  el  radio  crítico  de 
supervivencia  está  a unos  200.000  km  de  la  singularidad,  es  decir  a unos  66  • 1 0 6 veces  el  radio 
de  Schwarzschild.  En  general,  el  tiempo  propio  máximo  que  un  observador  tarda  en  llegar  a la 
singularidad  desde  el  radio  de  Schwarzschild  de  un  agujero  negro  con  masa  m es 

rmax  = l,5-10”5—  s,  (11.36) 

m.Q 

donde  m©  es  la  masa  del  Sol.  O sea,  unos  10_5s  para  un  agujero  negro  estelar,  pero  unas  cómodas 
4 horas  y pico  para  un  agujero  negro  supermasivo  de  10°  masas  solares. 
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Capítulo  12 


Cosmología  relativista 


Cuando  iba  a dar  un  seminario  en  Japón,  me  pidieron  que  no  mencionara  el  posible  recolapso 
de  universo,  porque  podía  afectar  a la  bolsa. 

(S.  Hawking,  1996) 


12.1.  Relatividad  general  y cosmología 

La  cosmología,  el  estudio  del  universo  entero,  es  casi  tan  antigua  como  la  civilización  huma- 
na. Ya  los  filósofos  presocráticos,  como  Thales  de  Mileto  o Anaximandro  (siglo  VI  A.C.)  pensaban 
poder  deducir  ciertas  afirmaciones  sobre  la  forma  y la  constitución  del  universo.  Sin  embargo,  la 
cosmología  sólo  ha  llegado  a formar  parte  de  la  física  cuando,  gracias  a la  relatividad  general, 
se  concibió  el  universo  como  un  sistema  dinámico,  regido  por  las  mismas  leyes  físicas  que  ri- 
gen la  materia  dentro  del  universo.  La  relatividad  general  predice  una  estrecha  relación  entre  la 
estructura  del  espaciotiempo  y su  contenido  de  materia  y energía.  Es  por  lo  tanto  un  paso  lógi- 
co intentar  utilizar  las  ecuaciones  de  Einstein  para  estudiar  la  dinámica  del  universo  entero:  su 
forma,  su  contenido  y su  evolución. 

Obviamente  es  imposible  encontrar  una  solución  exacta  de  las  ecuaciones  de  Einstein  que  des- 
cribe el  universo  entero  con  todas  las  estrellas,  galaxias,  ondas  gravitacionales,  campos  eléctricos 
y magnéticos  en  todo  detalle.  Pero  esto  tampoco  es  lo  que  pretende  la  cosmología:  la  cosmología 
describe  la  dinámica  del  universo  entero,  a muy  grandes  escalas,  donde  la  influencia  de  galaxias 
individuales  e incluso  cúmulos  de  galaxias  son  meramente  perturbaciones  despreciables. 

Aún  así  parece  que  para  poder  afirmar  algo  más  o menos  razonable  sobre  la  forma  o la  evolu- 
ción del  universo,  hace  falta  información  bastante  detallada  sobre  la  distribución  de  la  materia  o 
las  condiciones  iniciales,  cosas  difícilmente  obtenibles.  Sin  embargo,  la  cosmología  relativista  es 
capaz  de  sacar  modelos  muy  realistas  gracias  a dos  principios  básicos. 

El  primero  es  el  Principio  Cosmológico,  que  pretende  decir  algo  sobre  la  forma  del  universo. 
La  idea  es  que,  sea  como  sea  la  evolución  del  universo,  en  cualquier  momento  su  aspecto  es  el 
mismo  en  todos  los  puntos  y en  todas  las  direcciones.  Este  aspecto  puede  variar  a lo  largo  de  la 
evolución,  pero  por  lo  menos  varía  del  mismo  modo  en  todos  los  sitios.  Más  preciso,  el  Principio 
Cosmológico  se  formula  como: 


Principio  Cosmológico:  En  cualquier  momento,  el  universo  es  homogéneo  e isótropo  a muy 
grandes  escalas. 
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Por  lo  tanto,  el  Principio  Cosmológico  implica  que  la  métrica  del  universo  se  puede  escribir  como 
una  familia  de  hipersuperficies  (superficies  tridimensionales)  espaciales,1  cada  una  homogénea 
e isótropa,  que  representan  el  universo  a un  tiempo  t constante  y juntos  describen  la  evolución 
en  el  tiempo. 

Homogéneo  significa  que  todos  los  puntos  de  la  superficie  son  equivalentes,  no  hay  ningún 
punto  privilegiado.  Matemáticamente  esto  implica  que  la  métrica  de  la  superficie  tiene  tanta  si- 
metría que  es  posible  relacionar  cualesquiera  dos  puntos  de  la  superficie  a través  de  una  transfor- 
mación de  simetría.  Por  otro  lado,  la  isotropía  de  las  superficies  quiere  decir  que  no  hay  ninguna 
dirección  priviligiada,  que  las  superficies  tienen  el  mismo  aspecto  en  todas  las  direcciones.  Ma- 
temáticamente esto  implica  que  la  métrica  de  la  superfice  es  esféricamente  simétrica. 

Nótese  que  la  homogeneidad  es  una  propiedad  global  de  una  variedad,  mientras  que  la  iso- 
tropía es  una  propiedad  relacionada  con  un  punto  específico.  En  principio  la  homogeneidad  y 
la  isotropía  son  dos  propiedades  independiendes:  un  cilindro  es  homogéneo,  pero  no  isótropo, 
mientras  que  un  cono  es  isótropo  visto  desde  el  vértice,  pero  no  homogéneo.  Sin  embargo,  si 
un  espacio  es  isótropo  desde  cualquier  punto  (es  decir  globalmente  isótropo),  entonces  también 
es  homogéneo.  Y vice  versa,  si  es  isótropo  desde  un  punto  particular  y homogéneo,  entonces 
es  globalmente  isótropo.  Un  espacio  que  es  homogéneo  e isótropo  es  máximamente  simétrico,  es 
decir,  tiene  el  número  máximo  de  simetrías.  Matemáticamente,  las  variedades  que  son  máxima- 
mente simétricas  son  espacios  con  curvatura  constante,  una  propiedad  que  se  refleja  en  la  siguiente 
condición  sobre  el  tensor  de  Riemann, 

Rfj.vpX  = K (jj  pXQvp  QppQvX^J  > (12.1) 

donde  K es  una  constante  con  dimensiones  de  (longitud)-2,  que  está  relacionada  con  el  radio  de 
curvatura.2 

El  Principio  Cosmológico  resume  por  lo  tanto  lo  que  ya  habíamos  dicho  antes:  que  a escalas 
cosmológicas  el  universo  tiene  el  mismo  aspecto  en  todos  los  sitios,  ya  que  las  fluctuaciones  y per- 
turbaciones locales  están  promediadas  a estas  escalas.  En  cierto  modo  el  Principio  Cosmológico 
es  una  generalización  del  Principio  Copernicano:  mientras  que  Nicolaus  Copernico  (1473  - 1543) 
afirmaba  en  su  Revolutionibus  que  la  Tierra  no  ocupa  ningún  lugar  preferido  en  el  sistema  solar, 
el  Principio  Cosmológico  lo  afirma  para  cualquier  punto  del  Universo.  Originalmente,  más  que 
un  principio  físico,  el  Principio  Cosmológico  era  una  conjetura  de  simplicidad.  Como  veremos  en 
la  siguiente  sección,  este  principio  fija  casi  completamente  la  forma  de  la  métrica.  Si  el  Principio 
Cosmológico  no  fuera  verdad,  la  cosmología  relativista  sería  mucho  más  difícil  de  tratar. 

Aún  así  cabe  preguntarse  hasta  que  punto  el  Principio  Cosmológico  es  cierto.  Sabemos  por  las 
observaciones  que  las  estrellas  están  concentradas  en  galaxias,  éstas  en  cúmulos  de  galaxias  que 
a su  vez  forman  supercúmulos  con  grandes  vacíos  entremedios,  a escalas  de  10ñ  años  luz,  así  que 
a primera  vista  no  parecen  satisfacer  las  condiciones  exigidas  por  el  Principio  Cosmológico.  Sin 
embargo  observaciones  con  radioondas  y rayos  X cósmicos  indican  que  el  universo  efectivamen- 
te es  bastante  homogéneo  a escalas  de  109  años  luz.  Pero  la  mejor  indicación  del  la  veracidad  del 
Principio  Cosmológico  llegó  en  1965,  cuando  Arno  Penzias  (1933  - ) y Robert  W.  Wilson  (1936 
- ) descubrieron  la  radiación  cósmica  de  fondo  de  microondas,  correspondiendo  a la  radiación 
térmica,  proveniente  de  un  cuerpo  negro  con  una  temperatura  de  T = 2,  7 K.  Esta  radiación 
cósmica  de  fondo  es  en  realidad  el  residuo  de  la  radiación  térmica  de  un  pasado  mucho  más  ca- 

'Una  descripción  de  un  espacio  en  términos  de  hipersuperficies  (no  necesariamente  espaciales),  tal  que  cada  punto 
del  espacio  esta  situado  en  exactamente  una  hipersuperficie,  se  llama  una  foliación.  Los  Principios  Cosmológicos  dicen 
que  los  espacios  que  describen  solucones  cosmológicas  son  foliaciones  con  secciones  espaciales  de  curvatura  constante. 

2E1  análisis  dimensional  nos  dice  que  I\  es  básicamente  Rq2  ■ Sin  embargo,  el  signo  de  K varía  de  caso  en  caso. 
Nuestros  convenios  del  tensor  de  Riemann,  establecidos  en  el  Capitulo  7,  son  tales  que  para  el  caso  riemanniano,  la 
esfera  IV-dimensional  SN , el  espacio  con  curvatura  constante  positiva,  tiene  I\  > 0 y el  hiperboloide  WN , con  curvatura 
constante  negativa  tiene  K < 0.  Sin  embargo  para  el  caso  lorentziano  es  justo  al  revés:  el  espacio  de  De  Sitter  (12.67),  con 
curvatura  constante  positiva,  tiene  K < 0 y el  espacio  de  anti-De  Sitter  (12.70),  con  curvatura  constante  negativa,  tiene 
K > 0.  Disculpamos  por  las  molestias. 
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líente  del  universo  y fue  predicha  por  el  físico  ruso  George  Gamov  (1904  - 1968)  en  1948,  como 
una  consecuencia  directa  del  modelo  del  Big  Bang.  La  radiación  cósmica  de  fondo,  que  nos  pro- 
porciona información  sobre  cuando  el  universo  todavía  era  muy  joven,  resulta  ser  muy  isótropa, 
confirmando  de  manera  extraordinaria  el  Principio  Cosmológico.  En  realidad  no  fue  hasta  1992 
cuando  el  satélite  COBE  logró  medir  las  primeras  anisotropías  en  la  radiación  de  fondo,  cuyas 
fluctuaciones  son  sólo  del  orden  de  A T ¡T  ~ 10-5.  En  el  Capítulo  ??  haremos  una  discusión  más 
extendida  de  la  radición  de  fondo  cósmica  y lo  que  nos  enseña  sobre  el  universo  temprano. 

El  segundo  principio  básico  de  la  cosmología  relativista  es  el  Postulado  de  Weyl,  que  intenta 
modelar  el  contenido  de  materia  del  universo.  Igual  que  el  Principio  Cosmológico  afirma  que 
las  fluctuaciones  de  densidad  son  muy  pequeñas  a escala  cosmológica,  el  Postulado  de  Weyl 
dice  que  las  velocidades  propias  de  la  materia  son  pequeñas  en  comparación  con  el  movimiento 
cosmológico. 


Postulado  de  Weyl:  La  materia  a escalas  cosmológicas  se  comporta  como  un  fluido  perfecto, 
cuyas  componentes  se  mueven  a lo  largo  de  geodésicas  temporales,  que  no  se  intersectan, 
salvo  (posiblemente)  en  un  punto  en  el  pasado. 


También  el  Postulado  de  Weyl  se  ve  satisfecho  en  las  observaciones:  aunque  sin  duda  existen 
interacciones  gravitatorias  entre  las  distintas  galaxias,  que  en  ocasiones  llevan  las  galaxias  a co- 
lisionarse y mezclarse,  en  general  las  velocidades  particulares  causadas  por  estas  interacciones 
son  despreciables  con  respecto  a las  velocidades  generadas  por  la  evolución  del  universo. 

El  Postulado  de  Weyl  supone  una  clase  de  observadores  priviligiados  en  el  universo:  los  que 
están  en  resposo  con  respecto  al  fluido  perfecto  y cuyo  movimiento  por  lo  tanto  únicamente 
está  determinado  por  la  evolución  del  universo.  A estos  observadores  se  les  suele  llamar  observa- 
dores comóviles.  También  podemos  definir  un  tiempo  cosmológico,  siendo  la  dirección  temporal  de 
un  observador  comóvil.  Este  tiempo  cosmológico  será  útil  para  describir  la  evolución  del  univer- 
so y calcular  su  edad. 


12.2.  La  métrica  de  Friedmann-Robertson-Walker 

El  Principio  Cosmológico  y el  Postulado  de  Weyl  determinan  casi  por  completo  la  forma  de 
la  métrica  del  espaciotiempo.  Por  un  lado,  el  Postulado  de  Weyl  implica  que  se  puede  foliar  el 
espaciotiempo  con  una  familia  de  hipersuperficies  espaciales,  que  son  las  superficies  de  simulta- 
neidad t = cte  con  respecto  al  tiempo  cosmológico  t.  Y por  otro  lado,  el  Principio  Cosmológico 
dicta  que  estas  superficies  han  de  ser  maximalmente  simétricas.  El  Anstaz  para  la  métrica  por  lo 
tanto  se  puede  escribir  sin  pérdida  de  generalidad  como 

ds2  = dt. 2 — S2(t)  gij(x)dxldx\  (12.2) 

donde  gt  j es  la  métrica  de  las  secciones  espaciales  tridimensionales  con  curvatura  constante.  En 
otras  palabras,  el  tensor  de  Riemann  Rl3ki  de  la  métrica  g-i-j  satisface  la  condición 

Ríjki  — K {fjiiQjk  gikgj^j  • (12.3) 

La  función  S2(t)  es  el  factor  de  escala,  una  función  del  tiempo  cosmológico  que  mide  la  expansión 
o la  contracción  del  universo  (o,  para  ser  más  exactos,  de  las  secciones  espaciales).  Obsérvese  que 
para  que  las  secciones  espaciales  sean  homogéneas  e isótropas  en  todo  momento,  todas  las  di- 
recciones espaciales  tienen  que  evolucionar  de  la  misma  manera  y por  lo  tanto  el  factor  de  escala 
tiene  que  ir  multiplicando  a todas  las  direcciones  espaciales.  En  principio  es  posible  incluir  una 
función  del  tiempo  f2(t)  multiplando  el  término  dt2,  pero  es  fácil  de  ver  que  se  podría  absorber 
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esta  función  con  una  redefinición  de  la  coordenada  temporal.  La  métrica  (12.2)  con  la  condición 
(12.3)  es  por  lo  tanto  la  métrica  más  general  de  un  universo  homogéneo  e isótropo. 

El  problema  central  de  la  cosmología  relativista  es  determinar  las  funciones  S‘¿(t)  y gij{x)  en 
el  Ansatz  (12.2)  en  función  del  contenido  de  energía  y materia  del  universo.  El  factor  de  escala 
S2(t)  se  determinará  a través  de  las  ecuaciones  de  Einstein,  ya  que  éstas  describen  la  dinámica 
del  sistema.  Nos  ocuparemos  de  este  problema  en  las  siguientes  secciones.  Sin  embargo,  hallar 
gij{x)  es  un  problema  puramente  geométrico,  puesto  que  implica  resolver  la  ecuación  (12.3). 
Dedicaremos  el  resto  de  esta  sección  a encontrar  e interpretar  las  soluciones  de  esta  ecuación. 

La  isotropía  del  espacio  implica  una  simetría  esférica,  por  lo  tanto  podemos  escribir  la  métrica 
en  las  secciones  espaciales  como  (véase  sección  11.1) 

ds2  = e2S(f)df2  + f2  (cié*2  + sin2  (9dp2) , (12.4) 

donde  B(f)  es  una  función  aún  desconocida  de  la  coordenada  radial  f.  En  lugar  de  sustituir  este 
Ansatz  en  la  ecuación  (12.3),  vamos  a determinar  la  función  B(f)  a través  de  la  ecuación  para  el 
tensor  de  Ricci: 

Rik  = -2  Kgik.  (12.5) 

En  un  espacio  tridimensional  (como  es  nuestro  caso)  las  condiciones  (12.3)  y (12.5)  son  equiva- 
lentes,3 por  lo  tanto  es  preferible  resolver  la  última,  ya  que  es  más  sencillo  calcular  el  tensor  de 
Ricci  que  el  de  Riemann.  Sin  embargo  en  general  la  condición  (12.5)  es  claramente  más  débil  que 
la  condición  (12.3).  Todas  las  métricas  de  curvatura  constante  satisfacen  la  ecuación  (12.5),  pero 
no  todas  las  métricas  que  satisfacen  (12.5)  tienen  curvatura  constante.  Las  métricas  que  satisfacen 
la  ecuación  (12.5)  se  llaman  métricas  tipo  Einstein.4 

Los  símbolos  de  Christoffel  no  nulos  del  Ansatz  (12.4)  son  (ejerc.  ó compárese  con  (11.4)) 

pr_  — Jl'  p#  _ p^5  _ 1 

f ^ = -fe“2B,  = -siné»cos6»,  (12.6) 

f^  = -fsin20e-2B,  f£v  = cotgfl, 

de  modo  que  las  componentes  no-triviales  del  tensor  de  Ricci  vienen  dadas  por  (ejerc.) 

~ 2 Bf  ~ ~ ^ 

Rff  = — , Rgg  = -1  + e~2B  - fB'e~2B,  R^  = sin2  9 Rgg,  (12.7) 

r 

donde  la  prima  denota  la  derivada  con  respecto  a r.  La  ecuación  (12.5)  se  reduce  entonces,  en 
nuestro  caso,  a dos  ecuaciones  independientes 

y = I\e2B,  —e~2B (l  - r\B')  + 1 = 2 Kr2,  (12.8) 


que  tienen  como  solución 


1 - Kr 2 

3No  es  directo  ver  que  en  tres  dimensiones  las  dos  condiciones  son  equivalentes.  La  manera  más  fácil  es  observar  que 
al  resolver  (12.5)  todas  las  constantes  de  integración  (y  por  lo  tanto  la  solución  entera)  quedan  determinadas.  Una  manera 
más  elegante  es  darse  cuenta  de  que  en  tres  dimensiones  tanto  el  tensor  de  Riemann  como  el  de  Ricci  tienen  6 grados  de 
libertad  y por  lo  tanto  los  dos  llevan  exactamente  la  misma  información  sobre  la  curvatura  del  espacio.  En  otras  palabras, 
la  ecuación  (12.3)  no  impone  ninguna  restricción  más  que  la  ecuación  (12.5).  En  dimensiones  mayores  que  3 (es  decir,  en 
universos  5-dimensionales  o más),  sí  es  necesario  resolver  la  ecuación  (12.3). 

4Obsérvese  que  la  relación  entre  los  espacios  de  curvatura  constante  y los  espacios  tipo  Einstein  es  un  generalización 
de  la  relación  entre  el  espacio  plano  y un  espacio  Ricci-plano.  En  realidad  el  espacio  plano  y Ricci-plano  no  son  nada  más 
que  un  espacio  de  curvatura  constante  y un  espacio  de  Einstein  con  K = 0. 


(12.9) 
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La  métrica  de  una  superficie  (tridimensional)  con  curvatura  constante  viene  dada  por  lo  tanto 
por 

ds2  = — df2  +f2(  dd2  + sin2  dd<p2) , (12.10) 

1 — Kr¿  V / 

donde  la  constante  K puede  tener  un  valor  arbitrario  positivo,  negativo  o cero,  correspondiendo 
respectivamente  a una  variedad  tridimensional  con  curvatura  constante  positiva,  negativa  o cero. 
Para  interpretar  esta  métrica  y para  futuro  comodidad  es  conveniente  sacar  un  factor  común 
| A'|_1,  a través  del  rescaleo  de  la  coordenada  radial  f = r¡ \j' \ K (para  I\  / 0).  La  métrica  (12.10) 
entonces  coge  la  forma 

ds 2 = |iL|-1  - — -dr2  + r 2 (dd2  + sin2  ddip2  j , para  I<  ^ 0 


ds2  = di'2  + r 2 (dd2  + sin2  dd(p2^J , para  K = 0 (12.11) 

donde  ahora  la  constante  k está  definida  como  k = K/\K\. 

Para  interpretar  la  métrica  (12.11),  hay  que  considerar  uno  por  uno  los  tres  casos  de  K positi- 
vo, negativo  o cero.  El  caso  más  sencillo  es  sin  duda  I\  = 0:  en  (12.11)  reconocemos  directamente 
la  métrica  para  IR3  en  coordenadas  esféricas.  Esto  era  de  esperar,  ya  que  para  K = 0 la  ecua- 
ción (12.3)  se  reduce  a la  condición  para  el  espacio  plano.  Intuitivamente  sabemos  que  R3  es  un 
espacio  de  curvatura  constante,  puesto  que  tiene  curvatura  cero  en  todos  los  puntos. 

El  caso  K > 0,  es  decir  curvatura  constante  positiva,  es  un  poco  más  sutil.  Nótese  que  ahora 
k = 1 y por  lo  tanto  el  rango  de  la  coordenada  r cubre  sólo  el  intervalo  ] — 1,  1[,  ya  que  la 
componente  grr  se  vuelve  singular  cuando  r — > ±1.  Es  por  lo  tanto  natural  hacer  el  cambio  de 
coordenadas 

r = sin  X «=>■  dX=-j£ r==,  (12.12) 

de  modo  que  la  métrica  (12.11)  se  convierte  en 

ds2  = K-1  dX2  + sin2  x (dd2  + sin2  6»d<p2)  . (12.13) 

Esta  métrica  es  la  de  una  esfera  tridimensional  S3  con  radio  K~? . La  manera  más  fácil  de  verlo 
es  embeber  (12.13)  en  el  espacio  plano  cuadridmensional  R1  a través  de  las  coordenadas 

X1  = sin  y sin#  coscp,  X3  = sin  y cosí?, 

(12.1-4) 

X2  = K~2  sin  y sinf?  sin  p,  X4  = K~  2 eos  y. 

Claramente  estas  coordenadas  satisfacen  la  ligadura  (X1)2  + ( X 2)2  + (X3)2  + (X4)2  = A'-1,  de 
modo  que  las  coordenadas  {y,  d,  y}  efectivamente  describen  una  tres-esfera  en  K4  con  radio  K~? . 
Además  la  métrica  (12.13)  corresponde  a la  métrica  de  esta  tres-esfera,  porque  sustituyendo  la 
parametrización  (12.14)  en  la  métrica  cartesiana  de  IR1  (¡sin  olvidarse  de  la  ligadura!)  obtenemos 
(ejerc.) 

ds2  = (dX1)2  + (dX2)2  + {dX3)2  + (dX4)2  = K -1  dX2  + sin2  y (dd2  + sin2  6»dy2)  . (12.15) 


El  último  caso  es  la  variedad  con  curvatura  constante  negativa,  K < 0,  o equivalentemente 
k = —1.  En  este  caso  podemos  hacer  el  cambio  de  coordenadas 


r = sinh  y 


(12.16) 


de  modo  que  la  métrica  (12.11)  se  convierte  en 


ds 2 = K 1 dX2  + sinh2  y (dd2  + sin2  dd(p2^j  . 


(12.17) 
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Figura  12.1:  Los  tres  espacios  con  curvatura  constante  (aquí  en  su  versión  b ¡dimensional):  la  esfera  SN 
con  curvatura  positiva  (izquierda),  el  plano  con  curvatura  cero  (centro)  y el  hiperboloide  con 
curvatura  negativa  (derecha),  cada  uno  con  su  ángulo  azimutal  6.  La  esfera  E>N  se  puede  embeber  en  el 
espacio  euclideo  RJV+1/  mientras  que  el  hiperboloide  i*  se  puede  embeber  en  el  espacio  lorentiano  R1,JV. 


Esta  métrica  describe  un  hiperboloide  tridimensional  H3,  como  que  se  puede  comprobar  consi- 
derando la  parametrización 

X1  = sinhy  sin#  coso?,  X 3 = K~ 2 sinhy  eos 0. 

(12.18) 

X2  = K~  2 sinhy  sin#  sinp,  Xo  = K~z  coshy. 


El  hiperboloide  H3  no  se  puede  embeber  en  R4,  sino  en  su  versión  lorentziana,  el  espacio  de 
Minkowski  R1’3:  efectivamente,  las  coordenadas  satisfacen  la  ligadura 

(X0)2  - (X1)2  - (X2)2  - (X3)2  = K~\  (12.19) 

lo  que  determina  en  R1,3  una  superficie  a distancia  temporal  constante  1/ sJ\K\  del  origen  (véase 
la  figura  12.1).  La  métrica  (12.17)  se  obtiene  sustituyendo  la  parametrización  (12.18)  y la  ligadura 
en  la  métrica  ds 2 = (dX0)2  — (dX1)2  — (dX2)2  — (dX3)2  (aunque  con  signo  opuesto  por  ser  una 
superficie  temporal  en  un  espacio  lorentziano). 

En  resumen,  las  tres  superficies  tridimensionales  con  curvatura  constante  son  por  lo  tanto 
la  esfera  §3  (curvatura  positiva),  el  plano  R3  (curvatura  cero)  y el  hiperboloide  H3  (curvatura 
negativa).  No  es  sorprendente  que  fue  en  estos  espacios  donde  históricamente  se  desarolló  la 
geometría  diferencial,  dado  que  estos  son  los  casos  con  más  simetría:  la  geometría  plana  en  R3  de 
Euclides  (siglo  III  A.C.),  la  geometría  esférica  por  la  cartografía  y astronomía  y la  geometría  no- 
euclidea  de  Nicolay  Lobachevsky  (1792  - 1856)  y János  Bolyai  (1802  - 1860)  para  el  hiperboloide 
en  el  siglo  XIX.  No  fue  hasta  Cari  Friedrich  Gauss  (1777  - 1855)  y Bernhard  Riemann  (1826  - 1866) 
a lo  largo  del  siglo  XIX,  cuando  se  generalizó  la  geometría  diferencial  a variedades  arbitrarias. 

Por  lo  tanto,  sustituyendo  la  forma  de  la  métrica  (12.11)  en  nuestro  Ansatz  cosmológico  (12.2), 
vemos  que  la  métrica  de  un  universo  homogéneo  e isótropo  siempre  se  puede  escribir  como 


ds2  = dt2  — a2(t) 


1 


L 1 — kr 2 


dr 2 + r 2 dd2  + sin2  Odyf 


(12.20) 


donde  hemos  absorbido  el  radio  \ K\  de  los  espacios  tridimensionales  en  un  nuevo  factor  de  escala 
a(t),  definido  como 


a(t)  = \K\  2 S(t)  para  K f 0, 
a(t)  = S(t ) para  K = 0. 


(12.21) 


La  imagen  por  lo  tanto  es  que  a cualquier  momento  t = fu,  las  secciones  espaciales  son  superficies 
de  curvatura  constante  y el  factor  de  escala  a(t)  representa  de  cierto  modo  el  "tamaño"  de  esta 
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superficie  espacial.  En  el  caso  de  k = 1,  la  función  a(t)  es  el  radio  de  la  tres-esfera  en  el  momento 
t y,  aunque  para  los  otros  dos  casos  es  más  difícil  visualisar,  el  aumento  o disminución  del  factor 
de  escala  implica  una  expansión  o contracción  de  la  sección  espacial  y marca  por  lo  tanto  una 
escala  en  las  secciones  espaciales.  La  expansión  del  universo  por  lo  tanto  no  se  corresponde  con 
la  imagen  de  diferentes  galaxias  alejándose  unas  de  otras  debido  a los  movimientos  radiales 
de  cada  una  de  ellas  en  un  espacio  fijo,  sino  más  bien  a la  imagen  del  contenido  de  materia  y 
energía  diluyéndose,  debido  a la  constante  creación  de  espacio,  con  el  aumento  del  factor  de 
escala.  Obsérvese  que  para  k = 0,  el  factor  de  escala  es  adimensional,  pero  para  k = ±1,  uÁt)  tiene 
dimensiones  de  longitud. 

La  métrica  (12.20)  se  llama  la  métrica  de  Friedmann-Robertson-Walker  (FRW),  llamada  así  por 
el  físico-meteorólogo  ruso  Alexander  Friedmann  (1888  - 1925),  el  físico  americano  Howard  Ro- 
bertson  (1903  - 1961)  y el  matemático  inglés  Arthur  Walker  (1909  - 2001).  Friedmann  propuso 
en  1922  la  métrica  (12.20)  como  Ansatz  para  el  universo,  dedujo  las  ecuaciones  de  Friedmann  y 
obtuvo  una  de  las  primeras  soluciones  realistas  de  un  universo  en  expansión.5  En  1935  y 1936 
Robertson  y Walker  demostraron  independientemente  que  la  métrica  que  propuso  Friedmann  es 
el  Ansatz  más  general  que  describe  un  universo  homogéneo  e isótropo.  Las  coordenadas  en  que 
está  escrita  la  métrica  de  FRW  en  (12.20)  se  suelen  llamar  coordenadas  comóviles,  ya  que  el  tiempo 
t es  el  tiempo  propio  de  un  observador  que  se  mueve  con  la  expansión  del  universo. 


12.3.  Las  ecuaciones  de  Friedmann 


Ya  que  tenemos  la  forma  general  de  la  métrica  de  un  universo  homogéneo  e isótropo,  po- 
demos concentrarnos  en  el  verdadero  problema  de  la  cosmología  relativista:  la  evolución  del 
universo,  codificado  en  la  dinámica  del  factor  de  escala  a(t).  Para  esto  hay  que  resolver  la  ecua- 
ción de  Einstein,  utilizando  el  Ansatz  que  acabamos  de  derivar  y la  descripción  apropiada  de  la 
materia. 


Para  calcular  los  tensores  de  curvatura  de  la  métrica  (12.20),  conviene  escribirla  como 

ds2  = dt2  — a2{t)  gij(x)  dxldx\  (12.22) 

donde  g,:i  (x)  es  la  métrica  de  las  secciones  espaciales  de  curvatura  constante,  que  hemos  calcula- 
do antes.  No  sólo  de  esta  forma  podemos  tratar  los  tres  casos  k = —1,0,1  simultáneamente,  sino 
también  resulta  que  el  resultado  es  explícitamente  independiente  de  las  coordenadas  utilizadas 
en  las  secciones  espaciales,  ya  que  lo  único  que  necesitamos  saber  es  que 


ddijki  — k(gugjk  9ik9jl ) ? — ‘-k[}¡j . R — 6 k . 


Un  cálculo  rutinario  revela  que  los  símbolos  de  Christoffel  non-cero  son 


r ij  = aágij , 


-pfc  -pfc 

1 ij  ~ 1 ij  ’ 


(12.23) 


(12.24) 


donde  el  punto  indica  derivar  con  respecto  a la  coordenada  t,  y los  • son  los  símbolos  de  Chris- 
toffel (12.6)  de  la  métrica  dij ■ Del  mismo  modo  el  tensor  de  Ricci,  el  escalar  de  Ricci  y el  tensor  de 
Einstein  vienen  dados  por 


Rtt  — 3 — , 


Rij  — 


2k  -f-  del  2 


9íji 


R = 6 


— 9 j u 

ci  k 4-  — + 

a \a 


© 


2l 


G„  = 


-3 


a 2k  + 


Gíj  = 


2 aá  + á2 


9íj  ■ 


(12.25) 


5 En  1927,  dos  años  después  de  la  muerte  de  Friedmann,  el  sacerdote  belga  George  Lemaitre  (1894  - 1966)  derivó  inde- 
pendientemente las  ecuaciones  de  Friedmann  y presentó  varias  soluciones  cosmológicas.  Por  eso  a veces  se  le  denomina 
(12.20)  como  la  métrica  de  Friedmann-Lemaitre-Robertson-Walker  (FLRW). 
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Aunque  no  es  estrictamente  necesario  para  resolver  las  ecuaciones  de  Einstein,  conviene  calcular 
también  el  tensor  de  Riemann,  para  estudiar  las  singularidades  de  las  soluciones  que  vamos  a 
encontrar.  Las  únicas  componentes  que  no  son  cero  son  de  la  forma 


Ptitj  — *Tó  (jij , 


Pijkl  — 


k + á2 


Í9il9jk  9ik9jl)- 


(12.26) 


Para  determinar  a(t),  hay  que  resolver  un  sistema  de  ecuaciones  diferenciales  para  el  factor 
de  escala  a{t),  que  se  obtiene  sustituyendo  el  Ansatz  de  FRW  (12.22)  en  las  ecuaciones  de  Einstein 

R»»  - ^9a uR  = -kTp.v,  (12.27) 

donde  el  tensor  de  energía-momento  contiene  las  contribuciones  de  todos  los  tipos  de  energía- 
momento  presente  en  el  universo  (materia,  radiación,  constante  cosmológica,  ...).  En  la  sección 
12.5  discutiremos  en  más  detalle  las  propiedades  de  los  distintos  tipos  de  materia  y energía,  pero 
de  momento  nos  basta  con  saber  que  por  el  Principio  de  Weyl  se  puede  considerar  el  contenido 
del  universo  como  un  fluido  perfecto.  Podemos  escribir  por  lo  tanto 

Ttt  = p,  Ttj  = a2cnjP,  (12.28) 


donde  p - P>>  y T = ff,,  Ra  son  respectivamente  la  densidad  y la  presión  total  de  todos  los 

tipos  de  energía  y materia  presentes  en  el  universo. 

En  1922  Friedmann  sustituyó  el  Ansatz  (12.22)  en  las  ecuaciones  de  Einstein,  obteniendo 
así  las  ecuaciones  de  Friedmann  (y  corrigiendo  un  error  que  comitió  Einstein  al  derivar  estas  ecua- 
ciones para  su  modelo  del  universo  estático  de  1917): 


k 


£ , IA2  = * p _ A 

a 2\a)  2 2a2' 


(12.29) 


Aunque  al  conjunto  de  estas  ecuaciones  se  les  llama  las  ecuaciones  de  Friedmann,  también  a la 
primera  ecuación  sólo,  la  componente  {tt}  de  la  ecuación  de  Einstein,  se  le  denomina  confusa- 
mente la  ecuación  de  Friedmann,  mientras  que  la  segunda,  la  componente  {ij},  se  llama  la  ecuación 
de  evolución.  Se  puede  simplificar  bastante  esta  última,  combinándola  con  la  ecuación  de  Fried- 
mann, dando  lugar  a la  ecuación  de  aceleración 


a 

a 


(12.30) 


La  ecuación  de  Friedmann  (12.29a)  relaciona  por  lo  tanto  la  velocidad  de  expansión  del  uni- 
verso con  la  densidad  de  energía  y con  la  curvatura  de  las  secciones  espaciales.  Obsérvese  que 
sólo  es  una  ecuación  diferencial  de  primer  orden  y por  lo  tanto  no  es  realmente  una  ecuación  de 
movimiento,  sino  más  bien  una  ligadura  para  a,  a,  p y k.  Por  otro  lado,  la  ecuación  de  evolución 
(12.29b)  sí  es  una  ecuación  de  segundo  orden  y actúa  como  la  ecuación  de  movimiento  de  a(t ) (de 
allí  su  nombre).  En  la  práctica  muchas  veces  basta  con  resolver  la  ecuación  de  Friedmann  para 
determinar  el  factor  de  escala.  Veremos  en  la  sección  12.5  que  la  ley  de  conservación  de  energía  y 
la  ecuación  de  Friedmann  implican  la  ecuación  de  aceleración. 

Finalmente,  a veces  conviene  reescribir  la  métrica  de  FRW  (12.22)  en  las  llamadas  coordenadas 
conformes,  donde  el  factor  de  escala  aparece  en  la  métrica  como  un  factor  conforme.  Se  define  el 
tiempo  conforme  r,  a través  de  una  reparametrización  de  la  coordenada  temporal,  como 

dr  = a~1(t)dt  <t=>  dt  = a(r)dr,  (12.31) 
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de  modo  que  la  métrica  (12.22)  coge  la  forma 


ds2 


2(t)  dr2  — gijdx'ldx- 7 


(12.32) 


donde  el  factor  de  escala  a(r)  = a(t(r))  ahora  es  una  función  del  tiempo  conforme.  El  tiem- 
po conforme  no  es  el  tiempo  propio  de  ningún  observador  en  particular  (obsérvese  que  r tiene 
dimensiones  de  longitud  inversa  para  k = 0,  pero  es  adimensional  para  k = ±1),  pero  estas  coor- 
denadas tienen  algunas  ventajas,  como  por  ejemplo  dejar  claro  que  las  métricas  FRW  con  k = 0 
son  conformamente  planas. 

Los  tensores  de  curvatura  en  estas  coordenadas  vienen  dados  por 


Rrr  = 3 
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(12.33) 


donde  el  acento  indica  una  derivación  con  respecto  al  tiempo  conforme  r.  Las  ecuaciones  de 
Friedmann  en  estas  coordenadas  son  entonces 


-KO2  p 


k, 


a " l/a'\2 

a 2 V a J 


y la  ecuación  de  acelerción  viene  dada  por 


— = \na2(p  + 3P). 
a 6 


(12.34) 


(12.35) 


12.4.  Distancias  y horizontes  cosmológicos 

Hay  varias  maneras  inequivalente  de  definir  distancias  entre  dos  puntos  en  una  métrica  de 
Friedmann-Robertson-Walker,  cada  uno  con  sus  ventajas  y su  significado  físico. 

Quizá  el  más  intuitivo  es  la  distancia  instantánea,  o la  distancia  geométrica.  Esta  definición  usa 
el  hecho  de  que  la  métrica  de  Friedmann-Robertson-Walker  tiene  un  tiempo  cosmológico  prefe- 
rido, el  tiempo  propio  de  un  observador  comóvil,  de  modo  que  podemos  calcular  la  distancia 
entre  dos  puntos  a un  tiempo  t constante.  Intuitivamente  equivale  a la  longitud  de  una  goma 
extendida  entre  dos  puntos.  Sin  pérdida  de  generalidad  podemos  tomar  uno  de  los  dos  puntos 
en  el  origen  del  sistema  de  coordenadas,  de  modo  que  el  desplazamiento  sea  puramente  radial. 
En  otras  palabras  podemos  tomar  dt.  = dCl 2 = 0 en  la  métrica  (12.20).  La  distancia  geométrica 
está  entonces  definida  como 

D(t)  = J ds  = = «(*)  j dx’  = a(t)x , (12.36) 

donde  en  la  tercera  igualdad  hemos  usado  el  cambio  de  coordenadas  (12.12)  para  k = 1,  (12.16) 
para  k = —1,  y simplemente  tomamos  % = r para  k = 0.  Vemos  por  lo  tanto  que  la  distancia 
geométrica  es  la  distancia  euclidea  y entre  los  dos  puntos,  medida  dentro  de  las  secciones  espa- 
ciales, multiplicada  por  el  fector  de  escala.  Al  expandir  o contraerse  el  universo,  las  distancias 
geométricas  entre  los  distintos  eventos  varían. 
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Podemos  calcular  la  velocidad  de  receso  de  las  galaxias,  derivando  la  definición  (12.36)  con 
respecto  a t : 

vTec  = D(t)  = á(t)  x = D(t).  (12.37) 

Evaluada  en  la  actualidad  t = U¡,  esta  ecuación  se  convierte  en  la  Ley  de  Hubble, 

viec  = H0  D(t),  (12.38) 

publicada  por  el  astrónomo  americano  Edwin  P.  Hubble  (1889  - 1953)  en  1929.  La  ley  de  Hubble 
establece  una  relación  lineal  entre  la  distancia  geométrica  D(t)  a la  que  se  encuentran  las  galaxias 
y su  velocidad  de  receso  viec,  donde  la  constante  de  proporcionalidad  es  la  constante  de  Hubble 
H0  — (.iÍJaí)  / uíti)) . Las  observaciones  de  Hubble,  que  dieron  lugar  a su  ley  empírica,  jugaron  un 
importantísimo  papel  en  la  aceptación  de  que  nuestro  universo  está  realmente  en  expansión, 
en  contraste  con  lo  que  la  humanidad  siempre  había  creído.  Obsérvese  que  la  ley  de  Hubble 
no  es  una  propiedad  específica  de  nuestro  universo,  sino  que  es  general  para  cualquier  modelo 
cosmológico  derivado  de  la  métrica  de  Friedmann-Robertson-Walker. 

En  realidad,  la  relación  lineal  entre  la  distancia  y la  velocidad  de  receso  solamente  es  válida 
para  distancias  pequeñas,  a orden  cero  en  el  desarrollo  de  Taylor  de  a(t).  En  general  la  relación 
entre  ambos  está  determinada  por  el  parámetro  de  Hubble 

H(t)  = |i,  (12.39) 

que  mide  la  velocidad  de  expansión  (o  contracción)  en  comparación  con  la  escala  del  universo. 
En  particular  la  evolución  del  parámetro  de  Hubble  con  el  tiempo,  H{t),  codificada  en  la  varia- 
ción del  parámetro  de  Hubble  como  función  de  la  distancia  (observacionalmente  medible  como 
función  del  corrimiento  hacia  el  rojo,  H(z)),  es  una  fuente  muy  valiosa  de  información  sobre  la 
evolución  de  nuestro  universo.6 

Como  tiene  dimensión  de  longitud  inversa,  el  parámetro  de  Hubble  marca  una  escala  de  tiem- 
po y de  distancia  para  el  modelo  cosmológico  en  consideración.  El  radio  de  Hubble  Rh  (t)  = H -1  (t) 
es  la  distancia  a la  que  la  velocidad  de  receso  de  las  galaxias  es  igual  a la  velocidad  de  la  luz, 
7jrec  = 1,  y galaxias  más  allá  del  radio  de  Hubble  tienen  velocidades  de  receso  superlumíni- 
cas,  como  se  puede  ver  en  la  ley  de  Hubble  general  (12.37)7  Por  otro  lado  el  tiempo  de  Hubble 
Tult)  = II  ~ l (t)  es  la  edad  que  tendría  el  universo  si  se  hubiera  expandido  siempre  con  la  misma 
velocidad  que  ahora,  y es  el  tiempo  que  necesita  la  luz  para  viajar  la  distancia  de  un  radio  de 
Hubble.  Obsérvese  que  el  tiempo  de  Hubble  no  es  (necesariamente)  la  edad  real  del  universo  (de 
hecho  sólo  lo  es  para  un  modelo  específico),  ni  el  radio  de  Hubble  es  la  frontera  del  universo 
visible,  como  veremos  en  breve. 

En  la  práctica  la  distancia  geométrica  (12.36)  no  es  muy  útil,  ya  que  no  es  una  cantidad  ob- 
servable: no  podemos  ver  dónde  están  las  galaxias  en  este  instante,  sólo  donde  estaban  cuando 
emitieron  la  luz  que  ahora  nos  llega.  Podemos  por  lo  tanto  definir  la  distancia  de  cono  de  luz  como 
la  distancia  espacial  que  ha  recorrido  la  luz  entre  emisión  y observación  o,  equivalentemente,  el 
tiempo  que  ha  tardado  en  llegar  hasta  nosotros.  Dado  que  la  luz  sigue  curvas  nulas  en  el  espa- 
ciotiempo  cuadrimensional,  tenemos  para  la  métrica  (12.20)  con  ds  = dfl 2 = 0,  que 

0 = dt2  — a2(t)d\2,  (12.40) 

6 El  parámetro  2 del  corrimiento  hacia  el  rojo  está  definido  como  1 + z = \¿/\e,  donde  Aei<j  son  las  longitudes  de  onda 
en  el  momento  de  emisión  y detección.  Para  el  caso  cosmológico,  donde  la  longitud  de  onda  cambia  con  la  expansión  del 
universo,  tenemos  que  1 + z = A¿/Ae  = a(to)/a(te). 

7Esto  no  contradice  los  postulados  de  la  relatividad  especial,  ya  que  su  velocidad  es  subluminica  para  un  observador 
inercial  local  (es  más,  será  cero  si  la  galaxia  no  tiene  una  velocidad  particular).  En  otras  palabras,  la  velocidad  de  receso 
(12.37)  no  es  la  velocidad  con  la  que  la  galaxia  se  mueve  por  el  espacio,  sino  la  medida  en  que  aumenta  su  distancia  hacia 
nosotros  debido  a la  expansión  del  espacio.  Recuerda  que  la  velocidad  "de  movimiento"  (no  de  receso)  sólo  está  de- 
finida localmente,  en  el  espacio  tangente  en  el  punto  donde  se  encuentra  la  galaxia,  y no  hay  ningún  observador  que 
medirá  velocidades  superlumínicas  es  su  entorno  local. 
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Figura  12.2:  La  distancia  geométrica  y la  distancia  de  cono  de  luz  en  una  métrica  del  tipo  Friedmann- 
Robertson-Walker:  La  distancia  geométrica  £>(¿2)  entre  dos  galaxias  es  la  distancia  física  que  separa  las 
galaxias  a t = i2  constante.  La  distancia  de  cono  de  luz  f(t2)  es  la  distancia  espacial  que  ha  viajado  la  luz 
emitida  por  una  galaxia  en  t = ti  hasta  ser  detectada  por  otra  en  t = í2. 


de  modo  que  la  distancia  de  cono  de  luz,  í = jf  d\',  viene  dada  por 


(12.41) 


Nótese  que  a_1(f)  = dx/dt.  es  la  velocidad  de  la  luz  a distancia  comóvil  x de  un  observador  en 
X = 0 (la  velocidad  de  la  luz  para  un  observador  local  siempre  será  1),  de  modo  que  (12.41)  es 
realmente  la  distancia  que  ha  recorrido  la  luz  entre  emisión  y detección. 

Para  cualquier  a(t)  no-trivial,  la  distancia  geométrica  y la  distancia  de  cono  de  luz  dan  resul- 
tados distintos.  En  particular  la  distancia  geométrica  siempre  es  finita,  mientras  que  es  posible 
que  la  integral  (12.41)  diverja.  Si  eso  ocurre,  quiere  decir  que  la  luz  que  estamos  detectando  viene 
de  distancias  arbitrariamente  lejanas,  mientras  que  si  la  integral  da  un  resultado  finito  el  modelo 
cosmológico  contiene  horizontes. 

Ya  hemos  discutido  brevemente  los  tipos  de  horizontes  cosmológicos  en  la  sección  9.4,  pero 
aquí  lo  haremos  de  forma  más  exacta.  Una  solución  cosmológica  tiene  un  horizonte  de  partículas  si 
la  integral  (12.41),  evaluada  entre  el  origen  del  universo  en  t = 0 (o  en  t = —00  si  no  tiene)  y la 
actualidad,  converge  a un  valor  finito, 

r*  dt ' 

^HP(Í)  = / 7T/T  < 00  • (12.42) 

Esto  quiere  decir  que  sólo  la  luz  de  las  galaxias  a distancias  menores  que  i hp  (t)  ha  tenido  tiem- 
po para  llegar  hasta  nosotros  desde  el  origen  del  universo.  Las  galaxias  detrás  del  horizonte 
de  partículas  £np(t)  están  demasiado  lejos  y su  luz  aún  no  nos  ha  alcanzado.  El  horizonte  de 
partículas  forma  por  lo  tanto  la  frontera  de  la  parte  visible  del  universo  y se  está  expandiendo 
constantemente. 

De  la  misma  manera  podemos  preguntarnos  hasta  dónde  alcanza  la  luz  que  emitimos  en  este 
momento.  Si  la  integral  la  integral  (12.41)  evaluada  entre  la  actualidad  y t = +00  (o  t = t¡,  si 
recolapsa  en  un  tiempo  finito), 

r°°  dt1 

W t)  = < 00,  (12.43) 

Jt  o(í) 
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Figura  12.3:  El  horizonte  de  parricidas:  Si  la  expansión  inicial  de  universo  es  suficientemente  rápida, 
el  cono  de  luz  pasado  no  intersecta  las  lineas  de  universo  de  todas  las  galaxias  (izquierda)  y una  parte 
del  universo  es  invisible  para  el  observador  (zona  oscura).  El  tamaño  del  horizonte  de  partículas  ( hp , la 
frontera  entre  la  parte  visible  y la  parte  invisible,  es  igual  a la  anchura  del  cono  de  luz  pasado  y crece  con  el 
tiempo  (linea  interrumpida).  Si  la  expansión  inicial  es  suficientemente  lenta,  el  modelo  no  tiene  horizonte 
de  partículas,  ya  que  el  cono  de  luz  intersecta  las  lineas  de  universo  de  todas  las  galaxias  (derecha),  de  modo 
que  el  universo  entero  es  observable. 


diverge,  entonces  las  influencias  causales  de  nuestro  "aquí  y ahora"  puede  llegar  arbitrariamen- 
te lejos.  Sin  embargo,  si  la  integral  (12.43)  converge  a un  valor  finito,  nunca  (más)  podremos 
influenciar  eventos  más  allá  del  horizonte  cósmico  de  eventos  ¿he (i). 

Finalmente  es  útil  definir  una  medida  para  la  aceleración  o deceleración  de  la  expansión  del 
universo.  Más  concretamente  se  define  el  parámetro  de  deceleración  como 

q(t)  = ~™.  (12.44) 

cr 

Obsérvese  que  q es  un  parámetro  adimensional,  que  indica  la  deceleración  del  universo  para 
valores  positivos  de  q y aceleración  para  q negativo. 

Podemos  ilustrar  estos  conceptos  con  unos  ejemplos  concretos.  El  primer  ejemplo  es  trivial, 
pero  sirve  para  aplicar  los  conceptos  a un  caso  conocido:  el  espacio  de  Minkowski,  como  métrica 
de  Friedmann-Roberson-Walker  con  a(t)  = 1.  El  parámtro  de  Flubble  y el  parámentro  de  decele- 
ración son  idénticamente  cero  y por  lo  tanto  el  radio  de  Hubble  es  infinito,  ya  que  este  universo 
no  tiene  evolución.  Esto  también  conlleva  que  a la  distancia  geométrica  y la  distancia  de  cono  de 
luz  de  un  punto  al  origen  coincide:  D(t)  = t(t)  = r.  Es  fácil  de  ver  que  los  integrales  (12.42)  y 
(12.43)  divergen,  lo  que  confirme  lo  que  ya  sabíamos:  el  cono  de  luz  en  el  espacio  de  Minkowski 
puede  alcanzar  tamaños  arbitrariamente  grandes,  de  modo  que  no  hay  ni  horizonte  de  partícu- 
las, ni  horizonte  de  eventos.  Veremos  en  el  Capítulo  ??  que  el  pasado  y el  futuro  del  espacio  de 
Minkwoski  tiene  una  estructura  causal  como  la  parte  derecha  de  las  Figuras  12.3  y 12.4. 

Un  ejemplo  un  poco  menos  trivial  son  los  modelos  cosmológicos  donde  el  factor  de  escala  es 
una  potencia  del  tiempo  cosmológico,  a(t)  = A0tn  para  algún  n > 0 y con  A0  una  constante  de 
proporcionalidad  poco  relevante  ahora.  Veremos  en  la  sección  12.6  que  una  clase  de  universos 
espacialmente  planos  se  comportan  de  esta  manera.  Es  fácil  de  ver  que  el  parámetro  de  Flubble 
y el  de  deceleración  vienen  dados  por 


1 ji 

H = nt~  , q = , (12.45) 

n 

de  modo  que  estos  modelos  cosmológicos  están  decelerados  si  0 < n < 1 y acelerados  si  n > 1. 
Nótese  que  el  radio  de  Flubble  crece  linealmente  en  todos  los  casos:  Rh  = n~1t.  La  distancia 
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Figura  12.4:  El  horizonte  cósmico  de  eventos:  Si  la  expansión  de  universo  es  suficientemente  rápida,  o 
si  el  universo  recolapsa,  el  cono  de  luz  futuro  no  intersecta  las  lineas  de  universo  de  todas  las  galaxias 
(izquierda)  y hay  partes  de  universo  a las  que  las  influencias  causales  del  observador  no  llegan  (zona 
oscura).  El  tamaño  del  horizonte  de  eventos  Íhe , la  frontera  entre  la  parte  influenciable  y la  parte  no 
influenciable,  es  igual  a la  anchura  del  cono  de  luz  futuro  y decrece  con  el  tiempo  (linea  interrumpida). 
Si  la  expansión  es  suficientemente  lenta,  el  modelo  no  tiene  horizonte  de  eventos,  ya  que  el  cono  de  luz 
intersecta  las  lineas  de  universo  de  todas  las  galaxias  (derecha).  Las  influencias  causales  llegan  por  lo  tanto 
arbitrariamente  lejos. 


geométrica  entre  dos  puntos  viene  dada  por  D(t)  = 
luz  es 


tndt. 
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Aotnr,  mientras  que  la  distancia  de  cono  de 
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(12.46) 


La  presencia  de  un  horizonte  cósmico  y de  partículas  también  depende  del  modelo,  ya  que  los 
integrales  (12.42)  y (12.43)  divergen  y convergen  según  el  valor  de  n: 
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(12.47) 


Es  decir  los  modelos  decelerados  tienen  un  horizonte  de  partículas,  pero  no  tienen  horizonte 
cósmico,  mientras  que  los  acelerados  justo  al  revés.  La  razón  es  que  los  modelos  acelerados  (los 
que  tienen  n > 1)  empiezan  su  expansión  muy  lentamente,  pero  aceleran  rápidamente  (tanto 
más,  cuanto  mayor  sea  n).  En  esta  expansión  acelerada,  las  velocidades  de  receso  de  galaxias  que 
inicialmente  eran  sublumínicas,  van  aumentando  con  el  tiempo,  alcanzando  y sobrepasando  la 
velocidad  de  la  luz.  En  otras  palabras,  el  radio  de  Hubble  crece  más  lentamente  que  la  expansión 
del  universo  y poco  a poco  las  galaxias  van  saliendo  del  radio  de  Hubble.  La  luz  emitida  por 
galaxias  suficientemente  lejanas  (es  decir,  con  velocidades  de  receso  suficientemente  altas)  nunca 
nos  alcanzará,  de  modo  que  hay  un  horizonte  de  eventos  (¡aunque  éste  no  coincide  con  el  radio 
de  Hubble!).  Sin  embargo,  debido  al  hecho  de  que  la  expansión  inicial  era  lenta,  no  hay  horizonte 
de  partículas. 

El  caso  decelerado  es  en  muchos  aspectos  justo  lo  contrario:  cuando  0 < n < 1,  los  modelos 
empiezan  su  expansión  inicial  muy  rápido,  pero  también  deceleran  pronto  (tanto  más,  cuanto 
más  baja  sea  n).  Las  galaxias  que  originalmente  tenían  una  velocidad  de  receso  super lumínica, 
están  deceleradas  hasta  velocidades  sublumínicas  y entran  en  el  radio  de  Hubble,  que  crece  más 
rápido  que  la  expansión  del  universo.  En  este  caso  sí  es  posible  ver  la  luz  emitida  por  galaxias 
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que  tienen  una  velocidad  de  receso  mayor  que  la  de  la  luz:  la  velocidad  de  los  fotones  emitidos 
hacia  nosotros  es  vrec  — 1,  que  es  positiva  (es  decir  los  fotones  están  recediendo)  en  las  zonas  de 
expansión  super lumínica.  Sin  embargo,  al  decelerar  la  expansión,  el  radio  de  Hubble  crece  más 
rápido  que  la  expansión  y en  cierto  momento  alcanza  a los  fotones.  Una  vez  dentro  del  radio 
de  Hubble,  ya  están  en  la  región  de  expansión  sublumínica  y finalmente  podrán  llegar  hasta 
nosotros.  En  este  caso,  no  hay  un  horizonte  de  eventos,  pero  debido  a la  expansión  rápida  inicial, 
sí  hay  un  horizonte  de  partículas. 


12.5.  El  contenido  de  energía  y materia  del  universo 

Como  hemos  visto,  la  evolución  del  universo  depende  de  la  densidad  de  energía  p y de  la  pre- 
sión P,  de  modo  que  hay  que  especificar  éstas  para  poder  resolver  las  ecuaciones  de  Friedmann. 
Sin  embargo,  a su  vez,  la  densidad  de  energía  y la  presión  cambian  con  la  evolución  del  universo 
y dependen  por  lo  tanto  del  factor  de  escala.  Necesitamos  entonces  información  adicional,  que 
determina  como  varía  a(t)  con  la  densidad  y la  presión. 

Esta  información  nos  la  dará  la  ley  de  conservación  de  energía, 

= 0.  (12.48) 


Aunque  (12.48)  es  una  ecuación  vectorial,  sólo  la  componente  temporal  nos  proporciona  una 
relación  entre  p,  P y a(t):  sustituyendo  (12.24)  y (12.28)  en  la  ley  de  conservación  de  energía, 
encontramos  en  coordenadas  comóviles 


p + 3^  (p  + P)  = 0.  (12.49) 

Esta  ecuación,  por  rara  que  pueda  parecer  a primera  vista,  es  en  realidad  una  identidad  conocida 
de  la  termodinámica.  Multiplicando  (12.49)  por  a3,  podemos  reescribirla  como 


(12.50) 


Si  interpretamos  a3(t)  como  el  volumen  de  un  trozo  de  la  sección  espacial  en  el  momento  t, 
vemos  que  la  ley  de  conservación  de  energía  dice  que  el  cambio  de  energía  en  un  volumen  es 
igual  a menos  la  presión  por  el  cambio  de  volumen.  En  otras  palabras,  hemos  recuperado  una 
formulación  de  la  primera  ley  de  la  termodinámica 


dE  = -PdV. 


(12.51) 


Con  la  ley  de  conservación  de  energía  podemos  demostrar  que  las  dos  ecuaciones  de  Fried- 
mann en  realidad  no  son  independientes:  derivando  la  ecuación  de  Friedmann  (12.29a)  con  res- 
pecto aíy  usando  (12.49),  obtenemos  depués  de  un  poco  de  cálculo  la  ecuación  de  aceleración 
(12.30).  La  ecuación  de  Friedmann  y la  conservación  de  energía  implican  por  lo  tanto  la  ecuación 
de  aceleración  y consecuentemente  la  de  evolución.  Dado  que  siempre  trabajaremos  con  fluidos 
perfectos,  que  satisfacen  la  conservación  de  la  energía,  en  la  práctica  sólo  tenemos  que  resolver 
la  ecuación  de  Friedmann  para  determinar  la  evolución  del  sistema. 

La  ley  de  conservación  de  energía  (12.49)  es  imposible  de  resolver,  si  no  especificamos  con 
qué  tipo  de  energía  estamos  tratando.  El  tipo  de  energía  o materia  viene  especificado  por  la 
dependencia  de  la  presión  Pa  de  la  densidad  pa,  expresado  en  la  ecuación  de  estado 

Pa  = W(a)  pa,  (12.52) 
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donde  W(a)  es  el  parámetro  de  la  ecuación  de  estado.8  En  principio  no  tiene  porqué  ser  constante, 
pero  la  homogeneidad  y la  isotropía  de  la  métrica  de  FRW  obliga  a i.V(o  j sea  independiente  de  las 
coordenadas  x.  Además  se  suele  tomar  iV(rrj  también  independiente  de  t:  cada  fluido  perfecto 
está  caracterizado  por  un  valor  de  Wfa^  y,  como  veremos  en  breve,  diluye  de  manera  diferente 
con  la  expansión  del  universo.  Si  en  distintas  épocas  el  universo  está  dominado  por  distintos 
tipos  de  energía,  es  preferible  caracterizar  estas  por  varios  fluidos  perfectos,  que  por  uno  solo 
con  un  parámetro  de  estado  variable  en  el  tiempo. 

Como  hemos  dicho  ya,  cada  valor  de  W(a)  define  un  tipo  de  fluido  perfecto.  Por  ejemplo, 
w = 0 corresponde  a un  fluido  perfecto  con  solamente  densidad  de  materia,  sin  presión  y describe 
por  lo  tanto  materia  fría,  sin  interacciones,  o polvo.  Por  otro  lado  w = 1/3  corresponde  a materia 
muy  caliente,  materia  relativista  o radiación  yw  = -l  corresponde  a una  constante  cosmológica. 
El  hecho  de  que  estos  valores  de  w correspondan  a estos  tipo  de  fluidos  se  deriva  a través  de 
las  leyes  de  la  termodinámica,  lo  que  nos  llevaría  fuera  del  ámbito  de  este  curso,  pero  sí  hay 
argumentos  que  nos  dan  cierta  intuición  de  que  sea  así. 

Sustituyendo  la  ecuación  de  estado  (12.52)  en  la  ecuación  de  conservación  de  energía  (12.49), 
encontramos  la  siguiente  ecuación  diferencial  para  pa  en  términos  de  a, 

Pa  + 3(w(a)  + 1)  ^ pa  = 0,  (12.53) 

que  sí  podemos  resolver.  En  general  tenemos  que  la  densidad  varía  con  el  tiempo  como 

pa{t)  = p0a~3^+1\t),  (12.54) 

donde  po  es  la  densidad  en  un  momento  dado  t = to  (por  ejemplo  en  la  actualidad)  en  que 
normalizamos  el  factor  de  escala  como  a(to)  = 1.  Vemos  por  la  tanto  que  cada  tipo  de  fluido 
perfecto  evoluciona  de  manera  distinta  en  la  expansión  del  universo.  En  particular,  para  materia 
fría  (w  = 0)  vemos  que  la  densidad  va  como  a es  decir,  la  materia  se  diluye  de  manera  inver- 
samente proporcional  al  volumen.  Por  otro  lado,  la  densidad  de  energía  de  radiación  (w  = 1 /3) 
evoluciona  como  a-4,  es  decir  aparte  de  diluirse  inversamente  proporcional  al  volumen,  pierde 
energía  en  el  corrimiento  hacia  el  rojo  de  la  radiación,  ya  que  al  expandirse  el  universo,  también 
aumenta  la  longitud  de  las  ondas  de  la  radiación  de  manera  lineal  en  a.  Por  último,  una  constante 
cosmológica  (w  = — 1)  proporciona  una  densidad  de  energía  constante  por  unidad  de  volumen. 
En  este  sentido,  una  constante  cosmológica  realmente  corresponde  a la  energía  del  vacío. 

Una  observación  interesante  surge  al  sustituir  la  ecuación  de  estado  en  la  ecuación  de  acele- 
ración: 

— = — -«(1+3 w)  p.  (12.55) 

a 6 

Una  expansión  acelerada  del  universo  sólo  es  posible  cuando  el  universo  está  dominado  por  un 
fluido  perfecto  con  parámetro  de  estado  w < — 1/3.9  Un  universo  con  materia  fría  o radiación 
sufrirá  una  deceleración,  debido  a la  atracción  gravitatoria  del  contenido  de  energía  y materia. 

Otra  observación  importante  sacamos  de  la  ecuación  de  Friedmann:  para  que  las  secciones 
espaciales  sean  planas  ( k = 0),  es  preciso  que  la  densidad  de  energía  en  el  universo  sea  igual  a 
una  densidad  crítica 

Pe  = - (-)2.  (12.56) 

Si  la  densidad  es  menor  (mayor)  que  la  densidad  crítica,  necesariamente  tenemos  que  k = — 1 
( k = +1)  y por  lo  tanto  las  secciones  espaciales  tienen  necesariamente  que  tener  curvatura  nega- 
tiva (positiva).  En  este  caso  se  suele  hablar  de  un  universo  abierto  (cerrado),  mientras  que  k = 0 

8 Anotamos  wra\  con  el  índice  entre  paréntesis,  para  enfatizar  que  en  la  ecuación  de  estado  no  estamos  asumiendo  una 
sumación  sobre  a. 

9Siempre  y cuando  la  densidad  de  energía  es  positiva,  como  en  la  gran  mayoría  de  los  fluidos  realistas.  Para  una 
constante  cosmológica  negativa  sin  embargo,  las  conclusiones  son  justo  al  revés. 
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se  le  denomina  un  universo  plano  (¡referiéndose  obviamente  a las  secciones  espaciales,  no  a la 
curvatura  cuadrimensional!). 

Podemos  definir  el  parámetro  de  densidad  total,  que  mide  la  densidad  total  en  términos  de  la 
dénsidad  crítica 

íítot  = (12.57) 

Pe 

Como  hemos  dicho  antes,  el  universo  es  espacialmente  plano  para  fitot  = 1/  abierto  para  í ítot  < 1 
y cerrado  para  íítot  > 1.  También  es  conveniente  definir  los  parámetros  de  densidad  parciales  de 
cada  componente  del  fluido  perfecto 

fia  = — , (12.58) 

Pe 

que  mide  la  importancia  de  cada  fluido  en  comparación  con  la  densidad  crítica.  Por  construcción 
tenemos  que 

= fitot.  (12.59) 


12.6.  Soluciones  cosmológicas 

Dedicaremos  el  resto  de  este  capítulo  a la  derivación  y discusión  de  algunas  soluciones  cos- 
mológicas concretas.  Aunque  ahora  creemos  que  ninguna  de  estas  soluciones  describe  bien  nues- 
tro universo,  merece  la  pena  dedicarles  un  poco  de  atención  por  su  interés  histórico  y matemático. 

El  universo  estático  de  Einstein 

En  1917  Einstein  fue  el  primero  en  aplicar  sus  ecuaciones  al  universo  entero  y presentar 
un  modelo  cosmológico.  Curiosamente  su  universo  estático,  no  sólo  fue  la  primera  solución  cos- 
mológica, sino  también,  junto  con  el  universo  de  Einstein-De  Sitter,  una  de  las  pocas  soluciones 
exactas  que  Einstein  mismo  obtuvo  de  su  ecuación. 

Guiado  por  los  prejuicios  científicos  de  la  época,  que  requerían  que  el  universo  fuera  estático, 
y obligado  por  las  ecuaciones  de  Friedmann,  que  dejan  bien  claro  que  un  universo  dominado  por 
materia  normal  (materia  fría  o radiación, ... ) necesariamente  se  está  expandiendo  o contrayendo, 
Einstein  se  vio  forzado  a argumentar  "que  las  ecuaciones  de  gravedad  que  he  defendido  hasta 
ahora  necesitan  una  pequeña  modificación. " Para  conseguir  una  solución  cosmológica  estática, 
tenía  que  introducir  la  constante  cosmológica  A,  con  dimensiones  de  masa/(longitud)3,  en  las 
ecuaciones  de  Einstein, 

fifi v ^e/fiu-fi  9“  nA  cj fu,  kT fu, ^ (12.60) 

que  representa  la  densidad  de  energía  del  vacio,  p\  = A (un  fluido  perfecto  con  w\  = — 1)  y gene- 
ra un  tipo  de  fuerza  cósmica  repulsiva  si  A es  positivo  y atractiva  si  A es  negativo.  Curiosamente, 
añadir  una  constante  cosmológica  es  la  única  manera  en  que  se  puede  generalizar  la  acción  de 
Einstein-Hilbert 

S = JdiX'M[hR  - a],  (12.61) 

sin  introducir  extra  grados  de  libertad,  ni  romper  la  covariancia  general,  ni  generar  ecuaciones 
diferenciales  de  orden  más  alto  que  2.  En  1915  Einstein  no  incluyó  este  término,  porque  no  tenía 
ninguna  razón  para  hacerlo,  pero  desde  su  introducción  en  1917,  la  constante  cosmológica  ha 
representado  uno  de  los  desafíos  más  grandes  de  la  física,  como  veremos  en  el  siguiente  capítulo. 

Si  insistimos  en  un  universo  estático,  es  decir  á(t)  = 'ú(t)  = 0,  la  ecuación  de  aceleración, 

0 = ^(1  + 3 tü(a))pa,  (12.62) 
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nos  obliga  a tener  aparte  de  las  formas  normales  de  energía,  un  fluido  perfecto  con  un  parámetro 
de  estado  suficientemente  negativo  para  compensar  la  atracción  del  resto  de  energía.  Histórica- 
mente Einstein  derivó  su  solución  para  un  universo  con  materia  fría  y una  constante  cosmológica, 
pero  se  puede  sacar  también  una  solución  análoga  con  radiación  en  vez  de  materia  fría.  Tomando 
en  cuenta  que  para  la  materia  fría  wm  = 0,  vemos  que  la  ecuación  de  aceleración  está  satisfecha 
si  la  densidad  de  materia  y la  densidad  de  energía  del  vacío  están  relacionadas  como 

Pm  = 2pa-  (12.63) 

No  sólo  implica  esto  que  la  constante  cosmológica  tiene  que  ser  positiva  (ya  que  pm  > 0),  sino 
también  sugiere  un  primer  problema  con  la  solución:  para  que  la  solución  se  mantenga  estática, 
es  preciso  que  las  densidades  de  los  dos  fluidos  estén  exactamente  ajustadas  según  la  relación 
(12.63).  En  realidad  no  hay  ninguna  razón  a priori  para  suponer  que  las  densidades  se  comportan 
como  exige  la  solución,  ya  que  no  existe  ningún  mecanismo  dinámico  que  lleve  a ello.  Por  lo 
tanto,  por  muy  imprecindible  que  sea  para  la  existencia  de  esta  solución,  la  relación  (12.63)  parece 
completamente  ad  hoc.  Esto  es  lo  que  se  suele  llamar  en  la  física  un  problema  de  ajuste  fino,  y suele 
levantar  sospecha  en  los  casos  donde  aparece. 


Aun  así,  tomando  en  cuenta  (12.63),  la  ecuación  de  Friedmann  coge  la  forma 

0 = —kpm  — a~2k,  (12.64) 

y dado  que  pm  > 0,  tenemos  necesariamente  que  k 1.  En  otras  palabras,  se  puede  representar 
el  universo  estático  de  Einstein, 


ds 2 = dt2 


2 

npM 


d\2  + sin2  x dfí 


2 

2 i 


(12.65) 


como  un  cilindro,  donde  el  eje  del  cilindro  es  el  tiempo  y las  secciones  ortogonales  al  eje  re- 
presentan las  secciones  espaciales  §3  (véase  Figura  12.5).  La  luz  da  la  vuelta  al  universo  en  un 
tiempo  finito  y cada  observador  puede  ver  la  parte  atrás  de  su  cabeza.  Objetos  en  las  antípodas 
del  universo  parecen  muy  cerca,  ya  que  los  conos  de  luz  de  un  evento  primero  divergen,  pero 
luego  vuelven  a converger,  para  coincidir  todos  en  el  mismo  momento  en  el  punto  opuesto  del 
universo  al  que  han  salido. 


En  1930  Eddington  demostró  que  el  universo  estático  de  Einstein  no  es  estable,  por  la  razón 
que  ya  mencionamos  antes:  nececita  un  delicado  equilibrio  entre  la  atracción  gravitatoria  de  la 
materia  y la  fuerza  repulsiva  de  la  constante  cosmológica  y cualquier  perturbación  que  rompa 
este  equilibrio  hará  que  predomine  una  de  las  dos  fuerzas  y causará  la  expansión  o el  colapso  del 
universo.  Pero  el  verdadero  golpe  de  gracia  para  este  modelo  fue  el  descubrimiento  de  Hubble 
en  1929  de  que  el  universo  no  es  estático,  sino  que  las  galaxias  muestran  un  corrimiento  hacia  el 
rojo,  debido  a la  expansión  del  universo.  Einstein  retiró  su  modelo,  referiéndose  a la  constante 
cosmológica  como  el  error  más  grande  de  su  vida.  Curiosamente,  desde  1998  hay  indicios  obser- 
vacionales  muy  fuertes  (suficientemente  fuertes  para  otorgar  el  Premio  Nobel  de  Física  del  2011 
a los  astrónomos  Saúl  Perlmutter  (1959  - ),  Brian  Schmidt  (1962  - ) y Adam  Riess  (1969  - ),  por 
el  descubrimiento),  de  que  el  universo  está  actualmente  en  una  fase  de  expansión  acelerada,  de 
manera  muy  parecida  a como  si  hubiera  una  constante  cosmológica  positiva. 


El  espacio  de  De  Sitter 

En  el  mismo  año  que  Einstein  presentó  su  universo  estático,  el  astrónomo  holandés  Willem  de 
Sitter  (1872  - 1934)  sorprendió  a la  comunidad  científica  con  una  solución  de  un  universo  vacío 
(en  el  sentido  de  que  no  tiene  ni  materia,  ni  radiación),  pero  en  aceleración  constante,  debido  a la 
presencia  de  una  constante  cosmológica  positiva. 

Concretamente  el  espacio  de  De  Sitter  tiene  pm  = prad  = 0 y p\  >0  con  k = 0.  Con  estos 
parámetros  se  puede  integrar  la  ecuación  de  Friedmann  directamente,  obteniendo  como  solución 

a(t)  = et/R  (12.66) 
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Figura  12.5:  El  universo  estático  de  Einstein  (izquierda)  y el  espacio  de  De  Sitter  (derecha):  En  el  universo 
estático  de  Einstein,  las  secciones  espaciales  son  tres-esferas  §3  y la  luz  da  la  vuelta  al  universo  en  un 
tiempo  finito.  El  espacio  de  De  Sitter  se  puede  describir  en  coordenadas  FRW  tanto  con  secciones  espaciales 
planas  (k  = 0),  esféricas  (k  = 1)  o hiperboloides  (k  = — 1 ),  dependiendo  del  sistema  de  coordenadas  que  se 
elija. 


donde  f?0  = \/3/kA  es  el  radio  de  De  Sitter,  que  es  una  medida  para  la  curvatura  de  este  espacio. 
El  espacio  de  De  Sitter, 

ds2  = dt 2 - e2t/Ro  5i3dxldx3 , (12.67) 

representa  un  universo  sin  materia  en  expansión  exponencial  (el  parámetro  de  deceleración  (12.44) 
vale  q = —1),  por  causa  de  la  fuerza  repulsiva  de  la  constante  cosmológica.  Dos  observadores, 
que  inicialmente  están  arbitrariamente  cercanos,  se  alejarán  cada  vez  más,  hasta  perderse  literal- 
mente de  vista.  Llegará  un  momento  en  que  la  expansión  es  tan  grande,  que  a la  luz  no  le  da 
tiempo  de  llegar  de  un  observador  a otro  y los  observadores  ya  no  tendrán  manera  de  comuni- 
carse. Efectivamente  no  es  difícil  de  ver  que  el  espacio  de  De  Sitter  tiene  un  horizonte  cósmico  a 
una  distancia  (he  = f?oe_t^ñ°  del  observador.  Es  decir  la  parte  del  espacio  que  un  observador 
puede  llegar  a influenciar  decrece  exponencialmente  con  el  tiempo. 

Sin  embargo,  a la  vez  es  un  espacio  donde  nada  cambia:  la  aceleración  es  constante  a lo  largo 
del  tiempo  y no  tiene  materia  o radiación  que  pueda  diluirse,  de  modo  que  en  cada  instante  el 
espacio  de  De  Sitter  es  un  rescaleo  de  los  momentos  anteriores.  Igual  que  el  universo  estático, 
el  espacio  de  De  Sitter  no  tiene  principio,  ni  fin,  ha  existido  siempre  y seguirá  existiendo  eterna- 
mente. 


Es  interesante  calcular  el  tensor  de  Riemann  del  espacio  de  De  Sitter: 

Rtitj  = ~Rf2  e2t/Ro  gij , Rijki  = ~Rf2  e4t/Ro  (ga9jk  ~ 9ik9ji),  (12.68) 

puesto  que  satisface  la  condición  (12.1)  de  una  métrica  lorentziana  con  curvatura  constante  po- 
sitiva con  radio  Rq.  Efectivamente,  al  ser  máximamente  simétrico,  el  espacio  de  De  Sitter  es  el 
análogo  cuadrimensional  y lorentziano  de  una  esfera.  Podemos  por  lo  tanto  pensar  en  este  es- 
pacio como  la  solución  del  vacío  de  la  acción  (12.61)  en  presencia  de  una  constante  cosmológica 
positiva,  igual  que  el  espacio  de  Minkowski  es  el  vacío  de  la  acción  de  Einstein-Hilbert. 

Uno  se  podría  preguntar  cuál  sería  la  solución  correspondiente  a un  universo  vacío  con  cons- 
tante cosmológica  positiva,  pero  con  secciones  espaciales  con  k = ±1.  Un  cálculo  bastante  directo 
muestra  que  estas  soluciones  vienen  dadas  por 


ds2 

ds2 


di 2 — Rf  cos1i7(-R0  1t)  d\2  + sin2  x dUj 


dt2  — sinh2(R0  1í) 


dy2  + sinh2  x díl2 


( k — +1), 


(k  = -1).  (12.69) 
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Ahora,  al  calcular  el  tensor  de  Riemann  de  estas  métricas,  encontramos  que  también  satisfacen 
la  condición  (12.1)  de  curvatura  constante  positiva  con  radio  Rq.  Puesto  que  la  solución  de  la 
ecuación  (12.1)  es  única  para  cada  valor  de  K (por  lo  menos  localmente),  sabemos  que  en  reali- 
dad las  métricas  (12.69)  también  describen  el  mismo  espacio  de  De  Sitter,  pero  en  coordenadas 
diferentes.  De  hecho,  aunque  t,  t y i jueguen  cada  uno  el  papel  de  coordenada  temporal  en  la 
métrica  de  Friedmann-Robertson-Walker  (12.22),  son  en  realidad  distintas  maneras  de  parame- 
trizar  el  tiempo  (por  eso  sus  nombres  distintos).  Lo  que  acabamos  de  encontrar  es  que  es  posible 
foliar  el  espacio  de  De  Sitter  de  varias  maneras,  tanto  en  secciones  espaciales  abiertas,  cerradas  y 
planas,  gracias  a la  cantidad  de  simetría.  En  este  caso,  la  geometría  de  las  secciones  espaciales  es 
claramente  una  propiedad  que  depende  del  sistema  de  coordenadas  elegido.  Entreremos  en  más 
detalle  sobre  las  distintas  formas  de  la  métrica  de  De  Sitter  en  la  sección  ??. 

La  paradoja  de  los  modelos  cosmológicos  de  1917  por  lo  tanto  era  que  había  dos  soluciones: 
una  de  Einstein,  con  materia,  pero  sin  movimiento,  y una  de  De  Sitter,  con  movimiento,  pero  sin 
materia.  Sin  embargo  estas  dos  soluciones  no  tardaron  a insprirar  otra  gente,  como  Friedmann  y 
Lemaitre  a considerar  modelos  más  realistas. 


El  espacio  de  anti-De  Sitter 

Aunque  nunca  fue  considerado  como  un  modelo  cosmológico  realista,  es  útil  preguntar  cuál 
sería  el  vacío  de  la  acción  (12.61)  con  constante  cosmológica  A < 0,  es  decir  pm  = Piad  = 0 y 
Pa  < 0.  Un  vistazo  a las  ecuaciones  de  Friedmann  deja  bien  claro  que  tal  solución  sólo  es  posible 
en  coordenadas  FRW  para  k = — 1. 

Un  cálculo  muy  parecido  al  caso  anterior  muestra  que  la  solución,  llamado  el  espacio  de  anti-De 
Sitter  es  de  la  forma 


ds2  = dt 2 


Rq  sin2(f?0  1t) 


dx2  + sinh2  x dCl2 


(12.70) 


donde  ahora  Rq  = y^-S/nA.  El  espacio  de  anti-De  Sitter  en  cierto  modo  es  lo  contrario  del  es- 
pacio de  De  Sitter:  en  vez  de  ser  sometido  una  expansión  exponencial,  sufre  una  contracción 
continua.  Partículas  emitidas  desde  un  punto  inicialmente  divergen,  pero  la  atracción  de  la  cons- 
tante cosmológica  negativa  las  frena  y las  hacen  recolapsar  otra  vez  en  un  tiempo  finito,  como 
indica  el  factor  de  escala. 

Sin  embargo,  el  espacio  de  anti-De  Sitter  mismo  no  colapsa:  igual  que  el  espacio  de  De  Sitter 
es  perfectamente  regular  en  todo  momento  (en  realidad  t = 0 y t = Rqtt  son  singularidades  de 
coordenadas),  e incluso  satisface  la  condición  (12.1)  con  K = Rq2  (ejerc.)  En  otras  palabras,  anti- 
De  Sitter  es  un  espacio  de  curvatura  constante  negativa,  el  análogo  lorentziano  cuadrimesional 
del  hiperboloide  y por  lo  tanto  podemos  identificarlo  como  el  vacío  de  (12.61)  con  A < 0. 

Cabe  preguntar  entonces,  si  anti-De  Sitter  también  es  máximamente  simétrico,  igual  que  De 
Sitter,  ¿por  qué  sólo  se  puede  foliar  con  secciones  espaciales  abiertas?  La  respuesta  es  que  tam- 
bién existen  foliaciones  del  espacio  de  anti-De  Sitter  con  geometrías  planas  y curvatura  positiva, 
pero  la  métrica  con  estas  foliaciones  no  son  del  tipo  FRW.  (La  diferencia  está  en  que  la  coorde- 
nada perpendicular  a las  hipersuperficies  de  la  foliación  es  una  coordenada  espacial).  El  espacio 
de  anti-De  Sitter  no  se  suele  tomar  en  serio  como  modelo  cosmológico  (menos  aún  ahora  que 
hay  indicaciones  obervacionales  de  que  el  universo  pueda  tener  una  constante  cosmológica  po- 
sitiva), pero  sí  se  usa  mucho  como  herramienta  matemática  en  otros  terrenos  de  la  física  teórica, 
especialmente  en  teorías  de  holografía  (véase  sección  10.6).  Discutiremos  más  extensamente  las 
propiedades  geométricas  y las  formas  de  la  métrica  de  anti-De  Sitter  en  la  sección  ??. 


El  universo  de  Milne 

El  universo  de  Milne  es  una  solución  del  las  ecuaciones  del  vacío,  en  ausencia  de  materia,  de 
radiación,  e incluso  de  una  constante  cosmológica.  En  otras  palabras,  pm  = Piad  = p\  = 0.  En 
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Figura  12.6:  El  universo  de  Milne  como  una  sección  del  espacio  de  Minkowski:  el  universo  de  Milne  es  la 
parte  del  espacio  de  Minkowski  contenida  dentro  del  cono  de  luz  futuro  del  origen  (parte  en  blanco).  Las 
secciones  espaciales  con  k = — 1 en  las  coordenadas  FRW  son  superficies  de  puntos  a la  misma  distancia 
temporal  del  origen  (lineas  continuas).  Las  secciones  planas  (k  = O,  lineas  discontinuas)  de  las  habituales 
coordenadas  cartesianas  sí  cubren  todo  el  espacio.  Obsérvese  que  la  coordenada  t del  universo  de  Milne 
(k  = — 1)  no  es  la  misma  coordenada  que  la  coordenada  temporal  en  cartesianas. 


este  caso,  las  ecuaciones  de  Friedmann, 

& - 


a 


(12.71) 


dejan  dos  posibilidades:  o bien  k = 0,  ó bien  k = — 1.  El  primer  caso  es  trivial,  ya  que  sólo  permite 
la  solución  a(t)  = «o,  una  constante,  y la  solución  es  fácilmente  identificable  como  el  espacio  de 
Minkowski. 

El  otro  caso,  fc  = — 1,  el  universo  de  Milne,  tiene  como  solución  u(t)  = t (más  una  constante 
de  integración,  que  se  puede  absorber  en  una  redefinición  de  la  coordenada  t),  de  modo  que  la 
métrica  del  universo  de  Milne  coge  la  forma 


ds 2 = dt 2 


t2  dyf  + sinh2  \ dkl2 


(12.72) 


A primera  vista  parece  que  la  solución  es  singular  para  t — » 0.  Sin  embargo,  al  calcular  el 
tensor  de  Riemann  para  obtener  algún  invariante  de  curvatura,  vemos  que 

Rt.it  j = Rijki  = 0.  (12.73) 

En  otras  palabras,  también  para  el  caso  k = — 1,  ¡el  universo  de  Milne  no  es  más  que  el  espacio 
de  Minkowski!  Para  ser  más  exactos:  es  un  trozo  de  él:  la  métrica  (12.72)  representa  la  sección 
de  Minkowski  que  está  contenida  dentro  del  cono  de  luz  futuro  del  origen  de  las  coordenadas 
(í,  x,  0,  <p)  (véase  Figura  12.6).  Las  secciones  espaciales  son  los  conjuntos  de  puntos  a la  misma 
distancia  temporal  t del  origen  y por  la  signatura  lorentziana  del  espacio  de  Minkowski  tienen 
curvatura  constante  negativa  (obsérvese  que  la  coordenada  temporal  t en  la  métrica  (12.72)  no 
coincide  con  la  coordendas  temporal  de  la  base  cartesiana).  En  el  límite  t — * 0 las  secciones  espa- 
ciales se  aproximan  al  cono  de  luz,  que  es  una  superficie  nula,  lo  que  resulta  en  una  singularidad 
de  coordenadas.  Sin  embargo,  como  sabemos,  el  espacio  de  Minkowski  es  perfectamente  regular 
en  todos  los  puntos. 

El  universo  de  Milne  fue  presentado  en  1948  por  el  astrofísico  británico  Edward  Arthur  Milne 
(1896  - 1950),  no  tanto  para  presentar  una  solución  cosmológica,  sino  en  un  intento  de  buscar 
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una  nueva  teoría  para  la  gravedad,  una  alternativa  a la  relatividad  general,  llamada  Relatividad 
Cinemática,  una  teoría  que,  aparte  de  Milne  mismo,  nadie  nunca  ha  tomado  en  serio. 

Quizá  la  gran  lección  del  universo  de  Milne  es  que  uno  siempre  debería  ser  crítico  con  las 
soluciones  que  uno  obtiene.  No  siempre  es  fácil  darse  cuenta  si  una  solución  nueva  no  es  más 
que  una  solución  conocida  en  otras  coordenadas.  En  particular,  se  suele  decir  que  el  espacio  de 
Minkowski  es  la  solución  que  más  veces  ha  sido  redescubierta... 


El  espacio  de  Einstein-De  Sitter  y otros  universos  espacialmente  planos 

El  espacio  de  Einstein-De  Sitter  es  el  primer  modelo  más  o menos  realista  que  encontramos  en 
este  repaso  de  soluciones  históricas.  De  hecho,  aunque  presentado  en  1932  en  un  artículo  conjunto 
de  los  dos  científicos  que  aparecen  en  su  nombre,  fue  considerado  una  buena  descripción  de 
nuestro  universo  hasta  bien  avanzado  los  años  1980. 

El  espacio  de  Einstein-De  Sitter  supone  que  el  universo  consiste  principalmente  de  materia 
fría  con  densidad  crítica,  o sea  CIm  = 1 y Í2racj  = V.\  = 0.  Debido  a la  densidad  crítica  de  materia, 
las  secciones  espaciales  son  planas  (A:  = 0)  y la  ecuación  de  Friedmann, 

(IT  = \KpM ’ (1Z74) 

es  directamente  integrable,  si  recordamos  que  la  materia  fría  se  diluye  con  el  factor  de  escala 
como  pm{í)  = Po  a~3(t).  La  solución  a esta  ecuación  diferencial  es 

a(t)=^H0ty,  (12.75) 

donde  la  constante  H0  = \J lupa  es  el  parámetro  de  Hubble  en  el  momento  t = to  (cuando 
p(t o)  = po  y «(ío)  = !)•  La  métrica  del  espacio  de  Einstein-De  Sitter  es  por  lo  tanto  de  la  forma 

/ 3 \ 4 

ds 2 = dt2  - y—Hotj  d^dx'dx? , (12.76) 

y describe  un  universo  en  expansión  decelerada  ( q = 1/2).  Esta  métrica  parece  singular  para 

t.  — > 0 y efectivamente  el  escalar  de  Ricci, 


R=\  t~2,  (12.77) 

diverge  para  t = 0,  lo  que  implica  que  la  singularidad  es  física.  La  coordenada  temporal  corre  por 
lo  tanto  en  el  intervalo  ] 0,  oo[,  donde  la  singularidad  en  t = 0 representa  el  origen  del  universo. 
Se  suele  llamar  Big  Bang  tanto  a la  singularidad  inicial,  como  a los  modelos  cosmológicos  que  la 
predicen.  El  nombre  ("Gran  Bum")  lo  puso  el  astrofísico  británico  Fred  Hoyle  (1915  - 2001)  en 
una  entrevista  con  la  BBC  en  1950,  para  mofarse  de  la  idea,  puesto  que  él  era  partidario  de  la 
teoría  del  estado  estacionario,  que  predice  un  universo  sin  evolución,  de  edad  infinita.  El  espacio 
de  Einstein-De  Sitter  es  por  lo  tanto  el  primer  modelo  que  encontramos  según  el  cual  el  universo 
no  ha  existido  desde  siempre.10 

10Hay  que  tener  un  poco  de  cautela  con  esta  última  frase:  Con  "desde  siempre"  queremos  decir  un  tiempo  infinitamente 
grande.  Alrededor  del  año  400  A.D.,  el  teólogo  cristiano  (San)  Agustín  de  Hipona  (354  - 430)  se  preguntó  por  qué  Dios 
había  esperado  tanto  en  crear  el  mundo.  Si  bien  la  creación  tuvo  lugar  hace  6.000  años  (según  los  creacionistas)  o hace 
13  ■ 109  años  (según  la  cosmología  moderna),  ¿por  qué  en  ese  momento  particular  y no  hace  109°  años,  hace  109°° 
años,  o cualquier  otra  cantidad  arbitrariamente  grande?  Según  Agustín,  en  realidad  la  pregunta  no  tiene  sentido,  porque 
durante  la  creación  Dios  no  sólo  creó  el  mundo  (el  espacio),  sino  también  a la  vez  el  tiempo  y por  lo  tanto  no  hay  un 
"antes  de  la  creación".  Y si  Dios  es  eterno,  afirma  Agustín,  es  porque  Él  mismo  está  fuera  del  tiempo  (y  del  espacio). 
Incluso  sin  juzgar  sus  ideas  metafísicas,  hay  que  admitir  que  el  concepto  que  tiene  Agustín  sobre  el  espacio  y el  tiempo 
es  sorprendentemente  relativista,  para  ser  del  siglo  IV  A.D. 
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Figura  12.7:  La  evolución  del  factor  de  escala  para  distintos  valores  de  w (para  universos  espacialmente 
planos):  un  universo  dominado  por  materia  fría  (linea  fina  continua)  inicialmente  crece  más  lentamente 
que  un  universo  dominado  por  radiación  (linea  discontinua),  pero  decelera  menos  rápido,  de  modo  que 
después  de  un  cierto  tiempo  crecerá  más  rápido.  Todos  los  universos  con  w > — | deceleran,  el  universo 
con  w = — i (linea  punteada)  crece  de  manera  constante  y universos  con  w < — | (linea  continua  en 
negrita)  son  acelerados.  Los  universos  tienen  una  edad  más  elevada,  cuanto  más  bajo  sea  w.  Por  otro  lado, 
puesto  que  todos  tienen  el  mismo  valor  para  H0,  el  tiempo  de  Hubble  tH  es  el  mismo  para  todos. 


La  edad  del  universo  se  calcula  fácilmente  de  la  expresión  (12.75)  del  factor  de  escala:  deno- 
minando la  actualidad  t = to  y normalizando  el  factor  de  escala  como  a(to)  = 1,  vemos  que  la 
edad  del  universo  en  el  modelo  de  Einstein-De  Sitter  viene  dada  por 

t0  = yHf1.  (12.78) 

Hasta  la  segunda  mitad  de  los  años  1990,  se  estimaba  el  valor  actual  del  parámetro  de  Hubble 
Hq  entre  50  y 90  km/s/Mpc,11  lo  que  resultaba  en  una  edad  entre  aproximadamente  6,5  y 13  mil 
millones  de  años.  La  cota  superior  en  realidad  está  cerca  del  valor  que  se  cree  hoy  en  día,  pero 
la  cota  inferior  es  claramente  demasiado  corta,  puesto  que  hay  estrellas  y estructuras  que  son 
más  viejos  que  esto.  El  problema  más  grave  por  lo  tanto  del  modelo  de  Einstein  y De  Sitter  era 
que  predecía  una  edad  demasiado  corta  para  nuestro  universo.  En  el  siguiente  capítulo  veremos 
como  la  cosmología  moderna  resuelve  este  problema. 

Merece  la  pena  mirar  la  evolución  de  universos  espacialmente  planos  dominados  por  otro  tipo 
de  energía,  es  decir  para  w general.  Tomando  en  cuenta  que  la  densidad  de  energía  en  general 
desminuye  como  p(t)  = po  a~3^w+1\  la  ecuación  de  Friedmann  se  reduce  a 


á2  = Hq  a-3('u'+1/3), 


con  H0  definido  como  arriba.  La  solución  general  viene  dada  por 


a(t) 


r3(l  + w) 
2 


H0t 


2 

3(1+^) 


(12.79) 


(12.80) 


siempre  y cuando  w — 1 . El  caso  w = — 1 requiere  un  análisis  propio,  pero  en  realidad  este  caso 

es  él  del  espacio  de  De  Sitter  con  secciones  planas  (12.67). 

Obsérvese  que  el  factor  de  escala  depende  del  parámetro  de  estado  w,  y por  lo  tanto  universos 
con  distintos  contenidos  de  energía,  tienen  evoluciones  diferentes:  en  el  espacio  de  Einstein-De 

11E1  parámetro  de  Hubble  se  suele  medir  en  kilómetros  por  segundo  por  Megapársec  (1  Mpc  son  aproximadamente 
3,  3 ■ 10®  años-luz). 
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Sitter  el  factor  de  escala  va  como  a(t)  ~ i 3 , pero  por  ejemplo  un  universo  dominado  por  radiación 
(w  = 1/3)  crece  como  a(t)  ~ f 3 . Es  decir,  en  tiempos  primodiales,  un  universo  con  radiación  se 
expande  más  rápido  que  un  universo  con  materia,  pero  también  decelera  más  rápido,  de  modo 
que  tarde  o temprano  su  factor  de  escala  será  alcanzado  por  el  factor  de  escala  de  Einstein-De 
Sitter  y quedará  atrás  (véase  Figura  12.7).  Efectivamente,  un  universo  dominado  por  radiación 
tiene  q = 1,  el  doble  que  el  universo  de  Einstein-De  Sitter.  En  general  el  parámetro  de  deceleración 
de  estos  modelos  es  q — /(I  + 3 w):  En  otras  palabras,  los  universos  con  w > —1/3  tendrán  una 
expansión  decelerada,  mientras  los  con  w < —1/3  serán  acelerados.  Nótese  que  esto  coincide  con 
el  análisis  que  hemos  hecho  en  la  sección  12.4.  Sabemos  por  lo  tanto  que  los  primeros  tienen  un 
horizonte  de  partículas,  mientras  los  últimos  uno  de  eventos. 

Si  los  distintos  modelos  evolucionan  a ritmos  diferentes,  también  quiere  decir  que  tienen  eda- 
des distintas,  por  lo  menos  si  todos  coinciden  en  el  valor  actual  del  parámetro  de  Hubble  I ¡o 
(como  en  la  Figura  12.7).  Igual  que  en  el  caso  de  Einstein-De  Sitter,  se  calcula  la  edad  desde  el 
factor  de  escala.  De  (12.80)  vemos  que  para  w general  (pero  w / 1) 


to 


2 

3(u>  + l)fT0’ 


(12.81) 


y por  lo  tanto  el  universo  es  más  joven,  cuanto  más  alto  el  valor  de  w. 

La  métrica  general  para  universos  espacialmente  planos  (con  w ^ — 1) 


dsz  = dtz  — 


3(1  + w) 


H0t 


3U  + ») 


Sijdx1  dxJ , 


tiene  una  singularidad  del  tipo  Big  Bang  para  t = 0:  el  escalar  de  Ricci  viene  dado  por 

= 4 (w  - |)  2 

(w  + l)2  ’ 


(12.82) 


(12.83) 


lo  que  efectivamente  es  divergente  para  todo  w,  salvo  w - 4 . Para  saber  qué  es  lo  que  pasa  en 
este  último  caso,  tenemos  que  calcular  otro  escalar  de  curvatura.  Por  ejemplo,  vemos  que  para 
estas  métricas  el  invariante  de  curvatura 


= 


16(1  + 3 w2)  4 

9 (w  + l)4 


(12.84) 


es  singular  para  cualquier  valor  de  w,  y en  particular  para  w - /.  Todos  estos  universos  empeza- 
ron por  lo  tanto  con  un  Big  Bang,  salvo  w ^ — 1,  que  como  hemos  visto  ha  existido  desde  siempre. 


Universos  dominados  por  materia  con  k general 

Por  último  miraremos  a los  modelos  para  universos  con  materia  fría,  que  no  tengan  necesa- 
riamente la  densidad  crítica.  Ya  hemos  dicho  en  la  sección  12.5  que  si  la  densidad  es  menor  que  la 
crítica,  las  secciones  espaciales  tienen  curvatura  negativa,  mientras  que  si  la  densidad  es  mayor, 
las  secciones  espaciales  son  cerradas. 

Calcular  la  métrica  de  estas  soluciones  resulta  más  fácil  en  las  coordenadas  conformes  (12.32). 
En  estas  coordenadas,  las  ecuaciones  de  Friedmann  (12.34)  para  un  fluido  perfecto  con  w = 0 se 
pueden  escribir  como 

3 (h2  + k)  = na~1po,  2 h' + h2  + k =0,  (12.85) 

donde  h = a' /a  es  el  parámetro  de  Hubble  en  coordenadas  conformes  y la  prima  indica  una  deri- 
vación con  respecto  al  tiempo  conforme  r.  La  ecuación  de  evolución  se  puede  integrar  fácilmente 
para  r como  función  de  h,  resultando 

r = ~2/  W+k'  (12'86) 
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que  se  puede  resolver  con  técnicas  estándar  para  todos  los  valores  de  k. 

Miremos  primero  el  caso  k = 0,  a pesar  de  que  ya  sabemos  que  la  solución  es  el  espacio  de 
Einstein-De  Sitter,  para  familizarizarnos  con  las  coordenadas  conformes.  En  este  caso  la  integral 
(12.86)  se  resuelve  como 

/ii 

■p-  = 2h~1  + c,  (12.87) 

de  modo  que  podemos  escribir  h,  y por  lo  tanto  a,  en  función  de  r como 

2 

h = =>  a = n(r  + c)2,  (12.88) 

T — C 

donde  c y a son  constantes  de  integración.  Se  puede  reabsorber  c en  una  redefinición  de  r,  pero 
a será  determinada  por  la  ecuación  de  Friedmann,  que  todavía  nos  queda  por  resolver.  Sustitu- 
yendo la  solución  para  a en  la  primera  ecuación  de  (12.85),  vemos  que  el  factor  de  escala  viene 
dado  por 

a(r)  = \h20t\  (12.89) 

y la  métrica  es  de  la  forma 

ds 2 = dr2  - Sijdxidxj  . (12.90) 

Para  ver  que  esta  solución  es  realmente  el  espacio  de  Einstein-De  Sitter  (12.76),  sólo  hace  falta  ir 
a coordenadas  comóviles  a través  del  cambio  de  coordenadas  (12.31) 

1 r -1  i 

t = —H2  T3  ^ T = \ l2HY2  íj  . (12.91) 

Efectivamente  sustituyendo  la  expresión  para  r(t)  en  (12.89),  obtenemos  la  expresión  (12.75). 

El  caso  k = —1  es  nuevo,  pero  la  integral  (12.86)  es  fácilmente  obtenible: 

/ii 

— j — - = 2Arccotgh  h,  (12.92) 

de  modo  que 

h = cotgh^  =>  a = Ro  sinh2  ^ . (12.93) 

Otra  vez  la  ecuación  de  Friedmann  determina  la  constante  de  integración  como  Rq  = ^npu,  un 
parámetro  con  dimensión  de  longitud,  como  era  de  esperar,12  de  modo  que  métrica  viene  dada 
por 

ds2  = Rq  sinh4  ^ dr2  — d\2  — sinh2  x^2  ■ (12.94) 

Al  intentar  escribir  esta  métrica  en  coordenadas  comóviles,  nos  encontramos  con  un  problema 
técnico.  El  cambio  de  coordenadas  (12.31)  puede  expresar  t en  función  de  r 

t = —Ro  sinh  t — t , (12.95) 

pero  no  al  revés,  de  modo  que  no  podemos  obtener  una  expresión  exacta  para  a(t).  Sin  embargo, 
sí  podemos  aprender  algunas  cosas  de  esta  métrica,  mirando  a los  tensores  de  curvatura  y la 
evolución  en  tiempos  muy  tardíos. 

El  escalar  de  Ricci  viene  dado  por 

R = 3f?.(C2  sinh-6  (12.96) 

12Obsérvese  que  en  contraste  con  el  caso  k = 0,  la  densidad  po  en  un  momento  t = tg  se  mide  en  kilogramos  por 
ángulo  sólido  (tridimensional)  y tiene  por  lo  tanto  dimensión  de  masa. 
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Figura  12.8:  El  factor  de  escala  para  universos  dominados  por  materia  con  distintos  valores  de  k:  un 
universo  con  densidad  crítica  (k  = O,  linea  continua)  corresponde  al  espacio  de  Einstein-De  Sitter;  el  caso 
subcrítico  (k  = — 1,  linea  discontinua)  expande  más  rápido  y se  aproxima  en  tiempos  tardíos  al  espacio  de 
Minkowksi;  el  caso  supercrítico  (k  = 1,  linea  punteada)  expande  muy  rápido  inicialmente,  pero  está  frenado 
por  la  gran  cantidad  de  materia  y recolapsará  en  un  tiempo  finito.  Hace  falta  interpretar  este  diagrama  con 
cuidado,  puesto  que  a(t)  en  el  caso  k = O es  adimensional,  mientras  que  tiene  dimensión  de  longitud  para 
k = ± 1. 


de  modo  que,  al  igual  que  el  espacio  de  Einstein-De  Sitter,  tiene  una  singularidad  del  tipo  Big 
Bang  en  r = 0.  Sin  embargo,  la  expansión  es  mucho  más  rápida  que  en  el  caso  k = 0.  Aunque  no 
podemos  invertir  la  relación  (12.95)  en  general,  sí  podemos  mirar  lo  que  pasa  cuando  r 1.  En 
este  caso  tenemos  que 

t « \r0  eT,  (12.97) 

y por  lo  tanto 

a(t)  w t.  (12.98) 

Por  lo  tanto  vemos  que  un  universo  dominado  por  materia  con  densidad  más  baja  que  la  den- 
sidad crítica  se  aproxima  en  tiempos  tardíos  (o  no  tan  tardíos,  ya  que  va  exponencialmente)  al 
universo  de  Milne  (12.72),  que  a su  vez  habíamos  identificado  con  el  espacio  de  Minkowski.  En 
otras  palabras,  un  universo  con  densidad  subcrítica  se  expande  tan  rápido  y diluye  la  materia 
tanto,  que  el  universo  se  aproxima  al  espacio  plano.  La  evolución  del  factor  de  escala  para  todo 
r está  dibujada  en  Figura  12.8. 

Por  último,  miremos  el  caso  k = 1.  Entonces  la  integral  (12.86)  se  resuelve  como 

/TI 

— j — - = 2Arccotg  h,  (12.99) 

de  modo  que  podemos  escribir  h y por  lo  tanto  a en  función  de  r como 

h = cotg  ^ =>  a = R()  sin2  ^ . (12.100) 

Otra  vez  la  ecuación  de  Friedmann  determina  la  constante  de  integración  en  función  de  la  densi- 
dad p0  como  Rq  = \npo,  de  modo  que  métrica  viene  dada  por 

ds2  = Rq  sin4  ^ dr 2 — d\2  — sin2  ■ (12.101) 
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También  aquí  encontramos  problemas  al  intentar  escribirla  en  coordenadas  comóviles.  El  cambio 
de  coordenadas  (12.31)  puede  expresar  t en  función  de  r 


t 


t — sin  t 


(12.102) 


pero  no  al  revés.  Sin  embargo,  con  las  dos  expresiones  para  a(r)  y f (r)  sí  tenemos  una  parame- 
trización  de  a(t),  que  nos  permite  interpretar  la  solución:  la  curva  uít)  representa  una  cicloide, 
la  curva  trazada  por  un  punto  en  el  borde  de  un  círculo,  que  rueda  sin  deslizarse  (véase  Figu- 
ra 12.8).  El  factor  de  escala  por  lo  tanto  crece  inicialmente  muy  rápido,  pero  está  frenado  por  la 
gran  cantidad  de  materia  (recuerda  que  estamos  en  el  caso  super-crítico),  hasta  parar  del  todo  y 
contraerse  otra  vez.  Al  calcular  el  escalar  de  Ricci, 


R = 3-RT2  sin-6  — , 
0 2 


(12.103) 


vemos  que  la  métrica  no  sólo  es  singular  en  r = 0 (t  = 0,  el  Big  Bang),  sino  también  en  r = 27t,  o 
equivalentemente  en  t = ttRq  . El  recolapso  causará  un  aumento  de  la  densidad  que  resultará  en 
otra  singularidad,  parecida  al  Big  Bang,  denominado  Big  Crunch  (Gran  Recolapso),  que  hará  des- 
aparecer el  universo  entero.  Lo  curioso  es  que  cuanto  más  grande  la  densidad  del  universo,  más 
tardará  en  colapsarse. 

Vemos  por  lo  tanto  que  el  espacio  de  Einstein-De  Sitter  es  justo  el  caso  límite  entre  un  universo 
cerrado  y uno  abierto.  Teniendo  justo  la  densidad  crítica,  no  hay  suficiente  materia  para  frenar  la 
expansión  por  completo  y iniciar  un  recolapso,  ni  tampoco  tan  poca  que  ésta  se  diluya  del  todo 
y haga  que  el  universo  se  convierte  en  Minkowski. 


En  este  capítulo  hemos  repasado  algunos  de  los  modelos  cosmológicos  históricos,  que  en  su 
día  fueron  considerados  atractivos  por  razones  que  hoy  en  día  nos  pueden  parecer  poco  relevan- 
tes o incluso  ingenuas.  En  el  siguiente  capítulo  daremos  una  descripción  más  realista  de  lo  que 
se  cree  que  es  nuestro  universo. 
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Apéndice  A 

Convenios 


Es  más  probable  que  dos  físicos  compartan  el  mismo  cepillo  de  dientes 
que  los  mismos  convenios. 

(Anónimo) 


En  la  mayor  parte  del  libro  utilizamos  el  convenio  de  sumación  de  Einstein,  donde  se  supone  que 
se  suma  sobre  índices  superiores  e inferiores  repetidos: 

N 

V.W»  = (A.l) 

M=1 

Además  trabajamos  en  unidades  naturales,  donde  c = 1. 


A.l.  Relatividad  especial 


Un  punto  en  el  espacio  de  Minkowski  está  caracterizado  por  un  vector  cuadrimensional . 


con  componentes 


í x°  \ 

( f \ 

X 1 

X 

x2 

y 

V*3 ) 

\ * / 

(A.2) 


La  métrica  de  Minkowski  en  coordenadas  cartesianas  viene  dada  por 


/ 1 0 0 0 \ 

0-10  0 
0 0-10 
\ o o o — 1 / 


diag  (1,-1, -1,-1), 


de  modo  que  el  elemento  de  linea  es  de  la  forma 

ds 2 = r]lxl,dx^dxv  = dt 2 — dx2  — dy2  — dz2. 


(A.3) 


(A.4) 


Una  transformación  de  Lorentz  A1',,  es  una  transformación  lineal  en  el  espacio  de  Minkowski  que 
deja  invariante  la  métrica 

r/tiis  = ApAtA  (A. 5) 
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Un  vector  contravariante  V1'  y un  vector  covariante  V¡,  son  objetos  de  4 componentes  que  trans- 
forman bajo  una  transformación  de  Lorentz  AM„  como 

V'p  = APUV\  u;  = {A~1)\Vv.  (A.6) 

Contracción  con  la  métrica  convierte  un  vector  covariante  en  contravariante  y vice  versa, 

Vj a = Vn»Vv,  V p = rfvVv.  (A. 7) 

Un  tensor  de  rango  (m,  n)  TPl'"Pm  Ul_l/n  es  un  objeto  de  4m+n  componentes  que  transforma  como 

T'^  - ^Vl...Vn  = A^P1...  A^m  PmAXl  V1...  AXnVnTpl'Pmx1...xn-  (A.8) 

Contracción  con  la  métrica  ijpu  cambia  el  rango  de  un  tensor,  por  ejemplo: 

r)x  aTpvpx  = Tpupa,  yPxTpupx  = Tpvpp  = Tpu . (A.9) 


A.2.  Geometría  diferencial 


Bajo  un  cambio  general  de  coordenadas  ya  = yn(xp),  un  tensor  de  rango  (m,  n)  transforma 
como 

dxpi  dxp™  dyP” 

1 /3i.../3„  (A.1U) 


. . .¡¿m 


n dyai  dyam  dxUl  dxVn 

Contracción  con  la  métrica  gpv  cambia  el  rango  de  un  tensor,  por  ejemplo: 

9XoTpvp  x = Tpupa,  gP\TpvpX  = Tpvp  p = Tpv.  (A. 11) 

La  derivada  covariante  de  un  vector  contravariante  Vv  y de  un  vector  covariante  Vv  viene  dada 
por 


= dpV v + r^pvp, 

y de  un  tensor  de  rango  (m,  n)  por 


= d„Vv  - TpvVp, 


(A. 12) 


V7  I _1_ 

V p-1-  ...Vn  ~ Up-L  V\...Vn  ' L pX^  l • • • 


(A.13) 


_ _ "PA  rpp1...pm 

p\  vi  •••Vn  x pu\  A V2...Vn  * * * "L  pVn  ^ V\ . . .Vn  — 1 A * 


i pMm^/Ll.../Lm_l  A pA  rpp,i...p,. 

' L p\  ± VI... Vn  L pl/q 

La  conexión  transforma  bajo  un  cambio  general  de  coordenadas  y°  = yn(xJ'  ) como 


dxp  dxv  dy1  d2y1  dxp  dxv 


r 7 — 

J-  a — 


(A. 14) 


a/3  dya  gyf 3 gxp  p»  dxpdxv  dya  dy 13  ’ 

de  modo  que  la  derivada  covariante  de  un  tensor  de  rango  (m,  n)  es  un  tensor  de  rango  (m,n+ 1). 

Un  tensor  T/J1"‘/Ím„11,n  es  transportado  paralelo  a lo  largo  de  la  curva  C,  si  la  derivada  cova- 
riante del  tensor  a lo  largo  de  la  curva  es  cero. 


upVpT^-^Vl  = 0, 


(A.15) 


donde  uJ‘  es  el  vector  tangente  a la  curva  C. 

Un  variedad  tiene  una  curvatura  intrínsica  si  el  transporte  paralelo  de  vectores  y tensores 
entre  dos  puntos  depende  de  la  curva  entre  estos  dos  puntos.  Concretamente 

[VM,V„]SM-*»Al...AB  = Rp„aplS°P2-p™Xl...  xn  + ...  +Rpv„PmSPí-p™-'ax1...xn  (A. 16) 

— RpvXi a SPl  cr  A2 . . . A„  + ...  -RpvXn'TSp'-p™x1...Xn-1*  -T/í„Vff5',1-^A1...AB, 
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donde  el  tensor  de  Riemann  li I:  vf,x  y el  tensor  de  torsión  Tp  vienen  dados  por 


TD  A O pA  O pA 

J^¡ivp  - VpL  Uf)  UuL 


pA  per  pA  per 

1 /xcr1  vp  1 pp") 


'TP  = YP  — TP 
pv  x pv  x up’ 


(A. 17) 


Las  expresiones  para  la  geodésica  afín  y la  geodésica  métrica  son  respectivamente 

xa  + <¡  " }x,'xp  = 0,  (A.18) 


x°  + Tlpxvxp  = 0, 


A 

vp 


donde  los  símbolos  de  Christoffel  vienen  dados  por 

1 


A 

vp 


^pu9<yp  A ^p9va  • 


(A.19) 


La  expresión  de  la  geodésica  afín  sale  pidiendo  que  el  vector  tangente  a la  curva  sea  transportado 
paralelamente  a lo  largo  de  la  curva,  u'/Vl,uJl  = 0,  mientras  la  ecuación  de  la  geodésica  métrica 
sale  extremizando  el  funcional  s = J dr  \J (il,vil'xu . En  espacios  lorentzianos  hay  que  especificar 
el  tipo  de  geodésica: 


gpVxp'xv  = e, 


donde 


£ = 


1 si  xp  (r)  es  temporal, 
0 si  xp  (r)  es  nulo, 

— 1 si  xp  (r)  es  espacial. 


(A. 20) 


Si  la  conexión  TPJV  satisface  las  siguientes  dos  condiciones, 

1.  La  conexión  es  simétrica:  Tp  = Tp  , 

2.  La  derivada  covariante  de  la  métrica  es  cero:  V pgvp  = 0, 

entonces  TplIJ  es  la  conexión  de  Levi-Civita  y está  determinada  por  completo  por  la  métrica  y 
coincide  con  los  símbolos  de  Christoffel 


rA  = 

PA» 


A 

pp 


^9  {dp9&p  + dpgpa  d<r9pp^j  ■ 


(A.21) 


De  esta  expresión  se  puede  derivar  la  identidad  útil, 

1 


r»»  - 

í pu  — /¡— -'-'H 


VW\ 


(A.22) 


donde  hemos  utilizado  que  las  siguientes  identidades  para  el  determinante  g de  la  métrica 


Sgpv  = gppgvXSgpX, 


Sg  = g gpvSgpv  = -g  gp„ógp 


sV\g\  = \V\g\g^s9pv  = ■ 


(A. 23) 


El  tensor  de  Riemann  tiene  las  siguientes  propiedades  (asumiendo  la  conexión  de  Levi-Civita): 

Rpvpx  — Rvp,p\i  Rpvpx  = RpvXpi  RpLvpx  = Rpxp.vi  (A. 24) 

RpvpX  "h  RppXv  "h  RpXvp  b,  ^7 pRjy pXa  A V i/Rpf^Xa  4“  VpR^x*  b. 

A través  de  contracciones  con  la  métrica  se  puede  construir  el  tensor  de  Ricci  Rpu,  el  escalar  de 
Ricci  i?  y el  tensor  de  Einstein  G';,„ 


Ru 


= RppS  = gpxRpPvx  = dp^xx  - dxTx„  + rACTr^  - r^r^, 


R = g^R, 


pu 


G pv  — Rpu  rp9pvR- 


(A.25) 
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El  tensor  de  Ricci,  el  escalar  de  Ricci  y el  tensor  de  Einstein  satisfacen  las  seguientes  propiedades 
(asumiendo  la  conexión  de  Levi-Civita): 


Rfiu  Rvflt 


= -dvR, 


Gp,v  = Gv¡t,  WpGup  = 0. 

(A. 26) 

A.3.  Relatividad  general 

Las  ecuaciones  de  Einstein  son 

Rfns  2 8 7T G /V  I u . 

(A. 27) 

o,  en  la  forma  sin  traza, 

R/jm  = -8ttGn(Thv  - ■ 

(A.28) 

donde  la  expresión  para  el  tensor  de  energía-momento  viene  dada  por 


Tpv  = p0  u^uv 
T pv  = (p0  + P)upuv  - Pg^ 

Tpv  = -F»PFvp  + \gPuFp\Fpx 
Tpv  = A gpv 


para  polvo, 

para  un  fluido  perfecto, 
para  electromagnetismo, 
una  constante  cosmológico. 


(A. 29) 


Las  ecuaciones  de  Einstein  se  pueden  obtener  de  la  acción 


S = 


d^x^/lg] 


- 1 
-2k 


R + ¿Cu 


(A.30) 


donde  n = SttG'/y  y £mat  es  el  lagrangiano  que  describe  la  dinámica  y las  interacciones  de  los 
campos  no-gravitacionales.  El  tensor  de  energía-momento  TpV  correspondiente  a estos  campos 
no-gravitacionales  se  puede  obtener  a través  de  una  variación  del  lagrangiano  £mat : 


_ 2 ¿(y^dmat) 

~ VW\  6 9^ 


(A.31) 


La  ley  de  conservación  de  energía  y momento  implica  que  = 0. 

Una  ecuación  útil  para  derivar  las  ecuaciones  de  Einstein  desde  una  acción  es  la  identidad  de 
Palatini: 

6Rp„  = v„(5ri)  - vA(5r¿„)  + t;x{8  r¿„),  (a.32) 

donde  es  una  conexión  arbitraria  y Tpv  el  tensor  de  torsión. 

La  segunda  ley  de  Newton  y las  leyes  de  Maxwell  en  espacios  curvos  vienen  dadas  por 

m,o(xp  +Tppxvxp^  = fp, 

= jv,  dpFvp  + dpFpv  + dvFm  = 0,  (A.33) 

donde  F.lv  - d/(  A,,  — duAp.  La  ecuación  inhomogénea  se  puede  rescribir,  utilizando  (A.22)  como 


VW\F^]  = VW\f 


(A. 34) 
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La  solución  de  Schwarzschild,  en  las  coordenadas  de  Schwarzschild,  Eddington-Finkelstein 
y Kruskal  viene  dada  respectivamente  por 

ds2  = (l  - ^dt2  - (l  - ^-)^dr2  - r2(d02  + sin 2 9d<p2) 

= (l  - ^-)dP  - ^-dtdr  - (l  + ‘—¡—^jdr2  + r2[dd2  + sin2  9d ^2) 

= ^^—e-rl2M{dT2  — dR2^  — r2dSl\,  (A.35) 

donde 

t = t + 2M  log(r  — 2M), 

T = er/iMVr  - 2 M sinh(^) , i?  = er/4MVr  - 2Mcosh(-^) . (A.36) 
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Apéndice  B 

Bibliografía 


Hay  numerosos  libros  sobre  la  Teoría  de  la  Relatividad,  a muchos  niveles  distintos  y cada  uno 
con  sus  propios  puntos  de  vistas  y énfasis  particulares. 

En  la  preparación  de  este  curso  me  he  dejado  inspirar  por  las  lineas  de  razonamiento  de  tres 
libros  excelentes: 

■ Ray  d'Inverno,  Introducing  Einstein's  Relativity,  Oxford  University  Press,  1992. 

■ Sean  M.  Carroll,  Space time  and  Geometry,  Addison-Wesley,  2004. 

■ Derek  F.  Lawden,  An  Introduction  to  Tensor  Calculus  and  Relativity,  Wiley,  1962. 

El  libro  de  d'Inverno  es  pedagógicamente  un  libro  muy  bueno,  ideal  para  aprender  Relatividad, 
tanto  especial  como  general.  Aparte  de  su  buena  pedagogía,  cubre  temas  muy  amplios  y de  ma- 
nera bastante  profunda  para  un  libro  de  introducción  al  tema. 

El  libro  de  Carroll  es  igual  de  bueno  que  el  de  d'Inverno  explicando,  pero  tiene  un  estilo  un  poco 
más  teórico.  Presta  poca  atención  a tests  experimentales  pero  hace  bastante  referencia  a temas 
modernas  como  cosmología,  teoría  cuántica  de  campos  o temas  de  teoría  de  cuerdas. 

Finalmente  el  libro  de  Lawden  me  ayudó  mucho  cuando  yo  empecé  a estudiar  Relatividad.  Tiene 
una  excelente  introducción  de  álgebra  de  tensores  y una  buenísima  discusión  sobre  las  invarian- 
cias  de  la  mecánica  newtoniana,  la  teoría  de  Maxwell,  el  Principio  de  la  Relatividad  y el  Principio 
de  Equivalencia. 

Aparte  de  estos  tres  libros  hay  muchos  que  merecen  la  pena.  Mencionaré  aquí  algunos  libros 
clásicos,  sin  comentarlos: 

■ J.B.  Hartle,  Gravity:  An  introduction  to  Einstein's  General  Relativity,  Addison-Wesly,  2002. 

■ J.  Foster  and  J.D.  Nightingale,  A Short  course  in  General  Relativity,  Springer-Verlag,  1995. 

■ B.F.  Schutz,  A First  Course  in  General  Relativity,  Cambridge  University  Press,  1985. 

■ S.  Weinberg,  Gravitation  and  Cosmology,  Wiley,  1972. 

■ C.  Misner,  K.  Thorne,  A.  Wheeler,  Gravitation,  Freeman,  1973. 

■ R.  Wald,  General  Relativity,  Chicago  University  Press,  1984. 

En  internet  también  se  puede  encontrar  numerosos  cursos,  notas  y review  sobre  Relatividad: 
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■ S.  Carrol],  Lecture  Notes  on  General  Relativity, 1 
http : //fr . arXiv. org/abs/gr-qc/9712019 

■ M.  Blau,  Lecture  Notes  on  General  Relativity, 

http : //www . unine . ch/phys/string/lecturesGR.ps . gz 

■ G.  't  Hooft,  Introduction  to  General  Relativity, 

http : //www . phys .uu.nl/  thoof t/lectures/genrel . ps 

■ Stefan  Waner,  Introduction  to  Differential  Geometry  and  General  Relativity, 

http : //people  . hof  stra.  edu/f  aculty/Stef  an_Waner/RealWorld/pdf  s/Dif  fGeom.pdf 


1 Estas  notas  son  en  realidad  un  primera  versión  del  libro  mencionado  arriba.  El  libro  es  un  poquito  más  extenso,  pero 
en  grandes  lineas  las  notas  son  casi  iguales. 
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